Cátedra Procesamiento de Datos.
  Inicio | Programa | Teóricos | Prácticos | Saber Más | ¿Quiénes Somos?

Subsecciones

Convenciones
¿Qué es un weblog
Cómo se usa el weblog. Manual del MT
Enlace externo Enlace externo
Abre el enlace en un popup Abre el enlace en un popup
Enviar un mail Enviar un mail
   

Buscador


Sitios Favoritos Enlace externo

Archivo

El Libro
Alejandro Piscitelli
ISBN: 8497840607
Gedisa - 2005
 
InternetPiscitelli10.jpg


powered.gif
Estás en: Inicio > Herramientas > Google se tragó (sin atragantarse) un millón de weblogs
Google se tragó (sin atragantarse) un millón de weblogs
26.02.2003

Las Estrategias de Google

googlemondrian.gif

Desde que nos anoticiamos hace una semana que Google había puesto todo los cañones buscando apropiarse del mayor replicador de weblogs del mundo, Pyra Labs, dueña de Blogger, la duda no dejo de repiquetearnos. ¿Para que había hecho Google esta movida?, ¿cómo se vincula la misma con su estrategia anterior de agenciarse de 4.500 fuentes de información para construir un pool de noticias personalizadas, el Google News?, ¿en qué andan estos muchachos, hoy cuando hacer un e-negocio es casi una quimera?

Por suerte no todo el mundo come vidrio y ha sido mérito del reportero Leander Kahney de Wired haber descubierto a una persona que trabajó en estrecha colaboración con Pyra para tratar de darnos la repuesta ¿Porqué Google tiene interés en los diarios personales online? Esta nota e suna glosa de su feliz encuentro.

Lo que sigue llamando la atención es que a pesar de haberse conocido la noticia y haber sido sido replicada por muchas fuentes (1200 referencias en el propio Google una semana mas tarde de anunciada), siguie sin haber ningún dato concreto de cifras de compra, de estrategia, de plan de negocios vinculados, etc. ¿A qué obedece este secreto tan revelado a voces? ¿Porqué no se puede especular con ninguna certeza en un ámbito en donde delirar e imaginar castillos en el aire es toda una industria?

Es todo tan curioso que Evan Williams, cofundador de Pyra, que estuvo estos últimos tres años llevando un weblog de cada día de su vida, dejó de hacerlo justo ahora que la cosa se puso interesante. La semana pasada Williams sacó su blog de Internet.

Entretanto, miles de weblogs e índices de weblogs como Daypop y Blogdex se han visto inundados con debates acerca de lo que ese acuerdo significó para la Red, para las búsquedas, y para el blogging.

Por eso que Kahner haya dado con Chris Cleveland, CEO (Chief Executive Officer, o director ejecutivo) de Dieselpoint, una empresa de software de búsqueda con sede en Chicago que trabajó con Pyra el año pasado para desarrollar un buscador para el Blogger, es mas que bienvenido.

Al mismo tiempo sirve para echar algo de luz en este intríngulis, uno de los mas suculentos en el mundo de la red, donde hace bastante tiempo que no pasaba nada... salvo la explosión de los weblogs (como mero detalle las principales empresas españolas ligadas a la red perdieron U$ 30.000 millones en los ultimos 3 años y Terra tuvo que dar otro giro de 180 grados para sobrevivir).

Recuperando datos estructurados

Hacia falta pensar apenas un poco para darnos cuenta del secreto. La adquisición de Pyra por parte de Google sencillamente le ayudará a esta última a crear un buscador más preciso a través de la incorporación de nuevas y ricas fuentes de datos tomados de los weblogs. El secreto -y eso que la mayoría de nosotros todavía no usa la bendita función trackback- radica en la gran cantidad de hipervínculos que los webloggers crean cada día para indexar la Red.

Google se convirtió en el mejor buscador explotando la estructura de hipervínculos que conforma la Red. En lugar de utilizar una simple búsqueda por palabra clave, que es la forma en que la mayoría de los primeros buscadores encontraban los resultados, Google desarrolló un sistema patentado, llamado PageRank, que, además de las palabras claves, utiliza los hipervínculos para determinar qué páginas son las más populares en Internet.

El sistema del PageRank combina las búsquedas por palabra con un método que permite determinar la popularidad de una determinada página web a partir de la cantidad de vínculos que conducen a ella desde otras páginas que se ubican entre las más visitadas.

Es aquí donde entra en escena el Blogger. Los weblogs constituyen una fuente muy rica de hipervínculos, que son publicados sin demoras. Y no sólo eso: muchos weblogs se leen en RSS, o Rich Site Summary, un formato periodístico estándar que es fácilmente analizado e indexado por los spiders, los robots que utilizan los buscadores para recorrer la Red y crear un índice de la Web.

El RSS, que está basado en XML, es un formato cada vez más popular que es utilizado por miles de sitios de noticias de tecnología tales como CNN, The New York Times, Salon, Slashdot y Wired News, y por miles de weblogs.

Google probablemente utilizará el Blogger para desarrollar búsquedas sofisticadas que utilizan los ricos metadatos que forman parte de los contenidos en RSS de los weblogs: quién escribió qué cosa y cuándo, que vínculos a otros sitios se incluyeron, qué otros sitios brindaron vínculos a este sitio, y su nivel de popularidad entre los cibernautas.

El filtrado colaborativo dará mucho que hablar

A diferencia de los manifiestos grandilocuentes de la web semántica -iniciados con razón por Tim Berners Lee, que no sabemos si algun dia se cumpliran 1- lo que estamos viendo emerger aca es un metodo muy efectivo de acceder, no solo a las primicias, sino también al material más relevante según el criterio de la comunidad del webblogging.

Además, esas notas podrían estar acompañadas de los mejores comentarios hechos por webloggers populares, o por personas que escriben en un determinado idioma o desde un determinado país.

Cumpliendo por fin con las promesas que avizoraban a fines de los años 80 gente como Kristine Hooper de Apple, o como alguna vez vimos en una revista Verbum, refiriendose al simulacro de un software que permitiría escribir el estilo de... cualquier medio que uno quisiera, uno podría buscar 'Estados Unidos invade Irak' y recibir al instante la reacción del mundo frente a este hecho. y después uno podría buscar, clasificar, filtrar o agrupar (esos mensajes) usando los metadatos. Esto es lo que dice la gente en Francia (por ejemplo) 2 .

Hace un tiempo nos había llamado la atención la facilidad con que Google indizaba nuestros weblogs que en pocas semanas ss ponían al tope de búsquedas inesperadas con los miles de millones de páginas que hay en la red. Todo lo que Cleveland imagino esta camino de convertirse en verdad, pero cuando eso suceda habremos llegado a dos conclusiones impensadas.

1. Que los weblogs que siempre aparecen como los patitos feos de la película discriminados por las paginas webs tradicionales, resultan a la postre ser tecnologicamente mucho mas sofisticados, y con una estructura subyacente mucho mas útil para la clasificación, la segmentación y la búsqueda que las páginas convencionales.

2. Que ya es hora de salir del romance tecnológico y hasta ingenieril y de diseño con los weblogs, y ponernos a trabajar en serio en microcontenidos y en formatos temáticos específicos. En eso andamos.

Notas

1 De ningún modo queremos minimizar la importancia del proyecto de Tim Berners Lee, pero a veces los atajos, aunque no lleguen a los mismos resultados, se convierten en productos usables mas rápido, a costa de ciertos sacrificios funcionales. Para un análisis preliminar del proyecto de Berners-Lee referencias generales y contextuales asi como nuestro ensayo La Web Semántica Agentes que cambiarán al mundo -y no serán como 007.

2 Nos referimos en particular a las propuestas de Stephen Weyer en As we may learn en la compilación de Sueann Ambron & Kristina Hooper, (eds) Interactive multimedia. Redmond, Microsoft Press, 1988. También la extravagente y anticipadora nota acerca de los procesadores de palabras que escriben con el estilo de las revistas a las que quieren imitar, en una perdida nota de la revista Verbum de fines de los años 80.

Publicado por Piscitelli el Febrero 26, 2003 09:31 AM
Comentarios

Me gustaria saber cómo se utiliza el buscador google....

Publicado por: georgina pussetto a Agosto 3, 2004 08:35 AM

me gustaria saber como crear un buscador. como puedo copiar el contenido de letras de una web y guardarla en una base de datos.

Publicado por: piojoso a Marzo 28, 2006 08:20 PM
Haga un comentario