El teórico de hoy apunta a Dinámicas de la Web, pero es también el último de una serie de teóricos en los que nos internamos en una zona común que incluyó sistemas emergentes, mundos pequeños, tecnologías de la cooperación, redología y power laws: es como si tuviéramos las piezas de un rompecabezas sobre la mesa, cada uno con los títulos de estos teóricos y ahora tuviéramos que encastrarlos, integrarlos en algo común y para ser sinceros, todavía nadie ha logrado armar completamente el acertijo.
El caleidoscopio
Encontrar un orden en tanta diversidad se parece a un sueño (o pesadilla). Martín Luther King tuvo un sueño: "que mi pequeño hijo de cuatro años un día viva en una nación donde no lo juzguen por el color de su piel". Pero ya veremos lo del color de la piel.
Otro que tuvo un sueño fue Dimitri Mendeleiev. 
Era 1868 y se fue a dormir con todos los elementos de la naturaleza anotados en papelitos: calcio, magnesio, hierro, sodio, oro.... literalmente el rompecabezas de la materia del mundo. Quería establecer algún orden, alguna forma coherente en la que encajaran. Durante el sueño se le apareció la famosa "tabla de Mendeleiev" que surgía de aplicar el concepto de Power Laws a los elementos químicos. ¿Que hizo al despertar? Ordenó los elementos por orden decreciente según sus pesos atómicos y los relacionó con el volumen atómico correspondiente (como hicimos en otro teórico con las ciudades o los jugadores de fútbol) en un gráfico log log. Una vez ordenados los elementos por peso atómico, estudió sus propiedades químicas, en especial en cuanto a sus valencias. Estableció así períodos y huecos que dejó vacíos en su tabla: eran elementos aun no descubiertos, pero de los que ya podía describir propiedades...y hasta les dio nombres provisorios: desde los trabajos de Mendeleiev se establecieron las leyes de la potencia o power laws de los elementos químicos.
Usemos otra escena casi onírica: es 1930 y esta atardeciendo. Alguien camina por una calle suburbana de Buenos Aires, hacia el recientemente inaugurado sistema de iluminación nocturna del club Velez Sarsfield. Nuestro paseante suele ir a ver fútbol, pero esta vez va a escuchar y bailar tango. Va caminando y encuentra un reloj sobre la vereda. Es un reloj a cuerda, con agujas afiladas. Nuestro caminante es filósofo y se pregunta: ¿como puedo explicar este reloj? y se contesta: le preguntaré al relojero. Nuestro filosofo piensa en un relojero, porque son los relojeros los que se dedican a convertir linealmente, a través de una serie de engranajes muy minuciosamente ensamblados, la energía almacenada al darle cuerda en unas manecillas giratorias. Un relojero se parece a un escritor, piensa nuestro filosofo, porque piensa linealmente, como son líneas las que organizan nuestros textos. 
Ahora nuestro filosofo llega al club. Sobre una extensa alfombra que cubre el césped para protegerlo (el domingo se jugará al fútbol) , nuestro paseante observa la orquesta y a algunas parejas bailando. Podemos ver en uno de los laterales que, alrededor de las mesas, algunos prefieren escuchar las letras. Y se pregunta: como puedo entender este conjunto de personas, haciendo actividades tan distintas, pero de tal modo que puedo reconocer cierta unidad? ¿que me permite decir que estoy en una milonga en un club?
Piensa: seguramente esto no lo puede haber diseñado un relojero. Un relojero piensa en transformar linealmente la cuerda en los movimientos de las agujas, mediante engranajes. Un relojero no podría organizar todas esas cosas que están pasando en un mismo momento, influyéndose unas a otras (la música, las miradas, las letras de los tangos, los mozos, la orquesta, etc).
Entonces ¿Quien entiende una fiesta? Dado que no existen los fiestólogos posiblemente un ecólogo, piensa nuestro filosofo. O alguien que piensa en lo interaccional de la comunicación.
¿Como se agregan y desagregan las personas en una fiesta? ¿Que patrones emergen de la red de conversaciones y miradas? Nuestro filósofo recuerda: una bandada se forma a partir de interacciones entre cada uno de los patos de modo que, sin ningún líder o coordinador, movidos solo por conductas simples relacionadas con las conductas de los otros patos (velocidad de vuelo, distancia entre alas, etc) se forme una letra V perfecta.
Pero en una fiesta no solo emergen formas, dis-posiciones: tambien se generan subgrupos. ¿Como es posible? Nuestro filosofo advierte que en la milonga se van diferenciado grupos, cada uno con conductas semejantes entre si: unos bailan, otros conversan, otros ejecutan sus instrumentos.
Una forma de entender como se congregan las personas, siguiendo a Schelling, es con el modelo de segregación: suponemos una fiesta de 100 personas, distribuidos en grupos de 10 personas. Cada grupo, según unas condiciones iniciales definidas, cuanta con 5 hombres y 5 mujeres. Como las personas suelen inquietarse, aburrirse, ver otras cosas que llaman su atención, supongamos que cada un tiempo (T1) de cada grupo se alejan dos personas, al azar, hacia otros grupos. Luego de varias sucesiones temporales (Tn) la fiesta no variara: continuarán 10 grupos, de 10 miembros, con una distribución de géneros uniformes. Pero acá viene la novedad: supongamos que torcemos el azar y que a un grupo le sacamos dos hombres y los intercambiamos con dos mujeres de otro grupo.
El modelo nos sorprende. Algunos agentes se incomodan: especialmente los tres hombres que quedan en el grupo de siete mujeres que deciden desplazarse a otros grupos, porque los temas que discuten 7 mujeres nos les interesan y no pueden conseguir que sus temas se vuelvan predominantes. Pero ahora hay tres hombres que se desplazan a otros grupos, desplazando a mujeres, que prefieren ir al grupo de las damas para ser escuchadas. Si seguimos avanzando en el tiempo veremos que comienzan a formarse grupos de hombres y grupos de mujeres, algo que además es una observación cotidiana.
La conclusión fundamental del modelo de Schelling es que, aunque las personas (agentes) no quieren vivir en grupos separados, los grupos que forman con sus interacciones terminarán segregándose. Ninguno de los agentes tiene un conocimiento global ni puede anticipar las consecuencias de sus decisiones agregadas: se limitan a mirar a su alrededor, a evaluar si sus compañeros de grupo son lo suficientemente semejantes a ellos mismos, a decidir si eso les satisface, y a quedarse o moverse en consecuencia. Como los patos.
La simulación de Schelling no sólo exhibe la disparidad entre micromotivos y macrocomportamientos; también explica el por qué de esa discrepancia: las redes de interacción e interdependencia que vinculan a los agentes generan dinámicas no lineales que acaban transformándose en esos patrones de segregación. Cuando un individuo decide dejar su grupo, su decisión no sólo lo afecta a él, también afecta al resto del grupo: al irse de su grupo un hombre puede afectar las expectativas de otros agentes de hablar de fútbol y en consecuencia, también deciden marcharse. Y de esa "no linealidad" surge lo inesperado, lo no previsto, las consecuencias no intencionadas de la acción.
Cuando Schelling ideó su modelo, no había ordenadores que pudieran exhibir en una pantalla los resultados de la simulación. Sin embargo, su trabajo está considerado como uno de los clásicos en el área. El modelo reúne las características propias de los llamados sistemas multi-agente y hoy en día contamos con las herramientas materiales y conceptuales necesarias para extender su utilización.
Nuestro filosofo tiene alguna forma de empezar a entender la milonga...
Volvamos Martin Luther King 
¿Es posible que se cumpla su sueño? Según el modelo de Schelling será muy difícil mientras cada uno de los agentes interactúe de acuerdo a la premisas actuales: si soy latino prefiero un barrio latino, si soy negro prefiero vivir con negros, si soy caucásico lo mismo. Si soy millonario viviré entre millonarios, si pertenezco a la clase media en un barrio intermedio, si soy carenciado en un barrio marginal.
Repasemos: la simulación, como modo de crear metáforas, predice que los agentes participes de un sistema complejo tienden a segregarse y además que una vez segregados se agruparan alrededor de periodos que siguen las leyes de la potencia.
Zipf, futbolistas y almaceneros
Volvamos al fútbol: en la Argentina hay 20 equipos en primera división que se distribuyen simpatizantes mas o menos así, según la AFA: Boca 38 %, River 27 %, Independiente 9 % y Racing 6 %. Luego siguen San Lorenzo y Velez Sarsfield con unos porcentajes de simpatizantes que rondan entre el 6 y el 3 % del total, seguidos por otros 8 clubes que promedian entre 1 y 2 %.
Algunas conclusiones provisorias son:
1. Se cumple el principio de Pareto 20/80, dado que el 80 % de los hinchas siguen al 20 % de los clubes.
2. Se cumple la Ley de Zipf, dado que podemos reconocer una progresión logarítmica de agrupamiento:
a- 2 equipos mayoritarios
b- 4 equipos intermedios
c- 8 equipos menores
Vimos también que el en mundo de los científicos, evaluable a través de la las citas bibliográficas, encontramos algunos investigadores muchos mas citados que el resto (como algunos clubes): con adeptos se consiguen mas adeptos, parece. También vemos que las adhesiones de uno y otro pueden depender mas de la red de interacciones de las que participan que de sus propias cualidades. La calidad del club irá mejorando a medida que aumente la red simpatizantes, entre otras cosas porque contará con mas recursos económicos, por ejemplo.
Recordemos que estos son procesos emergentes. De una red de almaceneros emerge... adivinen. Sigamos el modelo de Schelling. Existen 10 almaceneros. Cada uno vende el kilo de azúcar a 5 pesos. Entonces a alguno se le ocurre bajar el precio a 4,5 pesos, consiguiendo aumentar sus ventas. Otros, pero no todos, imitan este comportamientos, segregándose dos grupos. 5 pesos y 4,5 pesos. Después de un tiempo, dado que los consumidores solo deciden comprar el azúcar a 4,5 pesos, algunos almacenes, supongamos 3 de ellos, cerrarán sus puertas, lo que indirectamente aumenta las ventas de los 7 restantes, dado que ahora cuentan con mas compradores. Tenemos 7 almacenes, pero 3 de ellos consiguen importar mas barato y bajan el precio a 4 $. Otra vez los compradores se concentran en este precio y se alejan de los otros, que también tienen que cerrar o cambiar de rubro.
Ahora quedan los tres almacenes finales. Venden mas barato, pero han concentrado mas compradores, por lo que sus ganancias son excepcionales. Y alguno hace la apuesta mayor y baja aun mas. ¿Imaginan el resultado? Si no se lo imaginan miren las góndolas del supermercado, la próxima vez que tengan que comprar azúcar: una vez destruida la red de almaceneros ha emergido un ganador que fija los precios... pero esa es otra historia. Estos procesos autoorganizados de concentración y segregación conllevan muchas veces perdida de diversidad, desencadenando un proceso destructivo (entrópico) del sociosistema irrecuperable. Otras veces, el sistema adquiere una nueva complejidad, de la que emergen nuevas estructuras. Después de todo no siempre existieron los almacenes.
El supermercado podría pensarse como un emergente de la interacción de almacenes y compradores, como la letra V que forma la bandada de patos, como un nido de termitas o un embotellamiento en la autopista también emergen de múltiples y pequeños intercambios. Los que estén interesados pueden profundizar algunas estos temas en consigan "Tortugas, termitas y atascos de tráfico" de Mitchel Resnick.
La Web
Vamos llegando a las dinámicas de "la Web" con mayúsculas, como totalidad o extensión de computadoras conectadas, con sus códigos y contenidos en general y de paso aprovechemos a aclarar que no hablaremos de "el web", dado que si usaramos el masculino estaríamos refiriéndonos a elementos puntuales o específicos, como "un website" o "el webserver".
Vimos en otros teóricos que la Web se comporta como los sistemas alejados del equilibrio (un colectivo de equipos de futbol, los almacenes de un barrio, un ecosistema, un mercado, un corazón, un hormiguero, etc), con una autoorganización tal que los mismos procesos que destila la Web son los que la producen. Si entendieron las reglas que mencionamoshasta acá ya comprenden las dinámicas de la Web. Seamos mas precisos ahora:
Vimos que emergen sitios (google, yahoo) que concentran muchísima atención de parte de los internautas y que esto conspira contra nuestros supuestos de equilibrio y justicia.La Web es un ecosistema informacional inmenso, pero, ¿cual es el tamaño de la Web? ¿Cual es la carnadura de la Web? ¿Como vive este ser digital?
Lo primero es distinguir entre stock y flujo de la información. Stock se refiere a los contenidos fijos en sitios webs (paginas html, archivos de imágenes, sonidos, etc) o en los archivos de mail en cambio flujo alude a los continentes dinámicos, como todo lo que circula en los chats, las páginas dinámicas .php o .asp, en los sistemas P2P, que solo existen como en su movimiento.
Existe una segunda distinción a tener en cuenta: vemos una Web superficial o "front" y en contraposición, tenemos a la Web profunda, que consiste en las bases de datos y sitios dinámicos inaccesibles para los internautas, aunque curiosamente la información existente en estas direcciones (el "back") es 500 veces más grande que la información disponible en la web superficial. Si denominamos web profunda a la información que no puede recuperarse con los mecanismos de búsqueda comunes quizás haya distintas formas de hacer invisible la información. Los robots de los buscadores tratan de abarcar toda la Web, pero se calcula que los mayores motores de búsqueda alcanzan a indexar sólo un tercio de los documentos disponibles.
La Web profunda además crece mas rápido que la superficial. Sherman y Price identifican cuatro tipos de contenidos invisibles en la Web:
La web opaca formada por los archivos que podrían estar incluidos en los índices de los motores de búsqueda, pero no lo están por diferentes razones: extensión, frecuencia de actualización, desconexión, etc.
La web privada consistente en las páginas web que podrían estar indexadas en los motores de búsqueda pero son excluidas deliberadamente por están protegidas por contraseñas o contienen archivos que bloquean a los robots.
La web propietaria que Incluye aquellas páginas en las que es necesario registrarse para tener acceso al contenido, ya sea de forma gratuita o pagada.
La web invisible propiamente dicha que se compone de páginas que no pueden ser indexadas por limitaciones técnicas de los buscadores.
Convengamos que realmente hay mucha información dando vueltas mas alla de que este visible o no: la producción mundial anual de impresos, películas, discos opticos (CDs y DVDs) y contenidos magnéticos requeriría unos 1,5 mil millones gigabytes de almacenaje, mas o menos el equivalente de 250 megabytes por cada persona en el planeta...!
Sigamos describiendo la morfología de la Web, antes de ponerla en movimiento.

En esta imagen se puede ver el crecimiento de la Web en billones de paginas de superficie desde agosto de 1999 hasta abril del 2001, según la investigación de Brian Murray, en la que se menciona también que el promedio de tamaño de las paginas era en 2001 de 10,060 bytes, con 23 links internos y 5,6 links externos, con un promedio de 14 imágenes por pagina. Se agregan a la Web por día 7,3 millones de páginas, aunque este crecimiento impresionante actualmente está decreciendo.Así, el tamaño total de la web de superficie oscilaba en 2001 entre los 25 y los 50 terabytes de información, de los cuales correspondían a información textual entre 10 y 20.
En cuanto al flujo de información mencionemos, siguiendo a "Internet, la imprenta del siglo XXI" que el correo electrónico se ha convertido en una de las formas de comunicación más extendidas y utilizadas de todas las épocas: un empleado de oficina estándar recibe unos 40 emails diarios. Aunque los números varían, se calcula que durante el año 2000 se enviaron entre 610.000 millones y 1.1 billones de emails. Dado que el tamaño promedio de un e-mail es de 18 K, el flujo puede llegar a 11.285 y 20.350 terabytes. Por supuesto que una cantidad ínfima de estos emails son almacenados. Se calcula que solo se guarda 1 de cada 17 mails que se reciben.
La Web estallada
Como un jarron que impacta contra la pared dejando esparcidos los pedacitos en el piso (que cumplirán una distribucion Zipf de tamaños) la Web se encuentra muy fragmentada, tal como la describió Albert Barabasi, uno de los investigadores que intentan entender los sistemas complejos como la Web, la propagación de enfermedades o las fluctuación de los mercados mediante la simulación informática en red a gran escala. Estas simulaciones frecuentemente se implementan usando grandes redes de computadoras que descomponen el problema total en muchos fragmentos y mediante robots digitales realizan muchísimas operaciones de un modo reticular, para después integrar todos los datos en representaciones globales.Como ya mencionamos Barabási pone el dedo en la llaga de lo antidemocrática y desigualitario (Zipf) de la red de redes sin red. Barabasi nos muestra que la topología de la Web nos deja ver muy poco, a excepción de algunos racimos de documentos que resultan indexables.
De hecho, los nodos no se conectan entre sí al azar, sino que, contrariamente y en un ambiente de constante competencia, buscan a otros nodos más atractivos. Barabási plantea la existencia de cierta aptitud evolutiva: posicionarse favorablemente en el Efecto Mateo es la estrategia clave para entender que sobrevive en Internet y en definitiva como se mueve la Web.Hasta acá describimos la Web, como si con un lupa hubiéramos intentado recorrer su piel milímetro a milímetro, pero ahora la palparemos, le vamos a tomar el pulso. ¿Que escuchamos, que cosas resuenan en el fondo de la Web? Que mueve la manivela para que toda esta ecología de archivos se nos aparezca viva?
Claves de la dinámica de la Web
1- Dispersión Power Law (potencial)
Las leyes de la potencia en realidad dicen algo que todos sabemos: los fenómenos especiales son escasos y los comunes abundan. Ya mencionamos a Pareto, Zipf o Lotka, todas estas regularidades permiten predecir cuan escasa va a ser la carestía o cuan poderoso en ganador. Cualquier inventario o análisis de la evolución de la red muestra su carácter exponencial como lo hemos testimoniado en numerosos gráficos y cuadros. Esta expansión está literalmente conectada a la naturaleza scale-free de la red.Hace un lustro 6 de cada 10 páginas no habían sido visitadas nunca, ahora 9 de cada 10. Sabemos que esta situación no puede esquivarse: es llamativo que, dado que nuestra vida depende cada vez más de la Web, sepamos tan poco de las Power Laws.
Dice Piscitelli "Más allá de las metáforas, y apelando a la memoria histórica, tenemos antecedentes conocidos donde estas distribuciones inequitativas están bien presentes: a fines del año 2004 existían en el mundo 63 millones de sitios web. Sabemos que una cantidad mínima de ese vasto universo concentra innumerables visitas y que, a la inversa, la mayoría parece no existir. A esto le llamamos red libre de escala." Además, en una conexión que no termina de sorprender al mas inquieto, ahora sabemos que la ecología de la información que explica a la Web es gobernada por las mismas matrices que rigen sistemas autorganizados desde el mercado del azucar hasta un grupo de delfines australianos. 
Así como en la historia de la evolución humana las piedras que necesitaban nuestros ancestros para sobrevivir fueron modelando filogenéticamente nuestras manos (tenemos dedos capaces de hacer oposición), la capa informacional (noosfera) que rodea el planeta se transforma al ritmo de nuestras destrezas cognitivas. Transformamos a la Web y en ese proceso nos transformamos cognitivamente, es por esto que prestar atención a estos fenómenos es tan crucial para comprender la comunicación social.
2- Conexión preferencial (preferential attachment).
Cada computadora debería conectar al router mas cercano, sin embargo el largo del cable es insignificante cuando del costo de las comunicaciones se trata. Para abaratar la conexión se trata del ancho de banda. Y no siempre es mucho mas económico conectarnos con un router cercano pero pobre en bits que con uno lejano pero mucho mas rico en ellos. Esta regularidad que aparece a nivel de la infraestructura de la red tambein se pueda hipotetizar en la capa del contenido: mucho mas significativo será estar linkiado a un sitio con muchas visitas.Como ya mencionamos al referirnos al efecto Mateo, en un efecto bola de nieve o una estructura el ganador se queda con todo (the-winner-takes-all).
3- Elección de la distancia mínima
Aunque en la Web es gigante y existen casi mil millones de internautas para buscar en google 8 mil millones de páginas, las investigaciones de Albert Lázsló Barabási demostraron que el grado de separación entre dos sitios web es de apenas 19 enlaces, a diferencia de los 6 links que separan a las personas físicas. Es decir que pocos movimientos del mouse nos permitirían cruzarla de punta a punta: así como 2 Km. de fibra óptica son mas caros que 0.5 Km., hacer 5 clics es mas costoso (atencionalmente) que hacer 2. Por otro lado así como hay mas routers donde hay mas demanda de ellos, los contenidos mas demandados serán los mas abundantes: poco queda al azar...
4- Geometría fractal
Como pronostico Tim Berners-Lee la web se va distribuyendo fractalmente. Pero ¿que es un fractal? Benoit Mandelbrot, un matemático polaco desarrolló una nueva geometría que describe los contornos irregulares y aparentemente caóticos del mundo que nos rodea: sus fórmulas permiten estudiar la configuración de árboles y nubes, cordilleras y costas, células y órganos, compuestos químicos y galaxias. 
En lo que previamente sólo se percibía confusión, desorden y complejidad, ahora se observan determinadas reglas de construcción. Mandelbrot encontró patrones, y esos patrones tienen un carácter "fractal": a grandes rasgos, las formas están hechas de pequeñas copias de sí mismas y sus partes son similares al todo: son parecidas pero a una escala menor.
Conclusiones
Para entender la dinámica de la red debemos tener en cuanta estas cuatro dimensiones: reconocimiento de las power laws, conexión preferencial, dependencia de la distancia y estructura fractal subyacente. Cada una de estas dimensiones, fuerade control, podrían destruir la red. Así si la longitud del cable fuera la única consideración a tener en cuenta la red podría fácilmente recaer en una estructura semejante a la de las autopistas, pero increíblemente las cuatro dimensiones interactúan entre si eliminando cualquier posible inestabilidad y haciendo posible una Red scale-free.
Lawrence Lessig divide a Internet en tres capas: infraestructura (computadoras, satélites, cables y hardware), código (software y aplicaciones) y contenidos. En esta capa de contenidos ha comenzado un proceso gradual de cierre a nivel global desde mediados de la década de los noventa. Es el punto caliente de la Web, donde la conflictividad abierta se expresa cuando se castiga a la madre de una adolescente que usa el sistema P2P kaaza o cuando los seguidores de Stallman se reúnen para discutir alguna estrategia para defender el código abierto frente a la avanzada del software propietario. Sin embargo, por mas que empujemos la palanca de la igualdad y la equidad las diferencias se instalan y a medida que progresa su evolución las distribuciones desiguales en la Web son la norma.
Quien es el responsable de la asimetría social, expresada en la Web?
Habrá que seguir con el rompecabezas...
Bibliografia:
T. Schelling, "Dynamic models of segregation", Jowrnal of Mathematical Sociology (1971)
T. Schelling, "Micromotives and macrobehavior" (Norton, New York, 1978).
Alejandro Piscitelli. "Internet, la imprenta del siglo XXI". Gedisa. 2005.
Mitchel Resnick. "Hormigas, termitas y atascos de tráfico". Gedisa. 2001.
Huberman, Bernardo. The Laws of the Web: Patterns in the Ecology of Information. 2001.
Links:
¿Sociedades Artificiales? Una Introducción a la Simulación Social
Center for Research in Social Simulation (CRESS)
Center for Computational Analysis of Social and Organizational Systems
Deep web research.Weblog con gran variedad de datos acerca de la Web profunda
Sitios mas concurridos de alimentadores de noticias de Usenet
Googlearchy": How a Few Heavily-Linked Sites Dominate Politics on the Web
Technorati (directorio de weblogs)
Using PageRank to Characterize Web Structure
The Electronic Small World Project
La web como ecosistema virtuoso/vicioso
Estrategias y mecanismos de búsqueda en la web invisible
Publicado por Mario K el Mayo 20, 2005 07:45 PM | TrackBack
