Para tener una idea de cómo funcionan los motores de búsqueda, es necesario saber que cuando un usuario realiza una búsqueda en Google en realidad no está realizando la búsqueda “en vivo” dentro de la Red sino que está buscando en un índice de la Red creado por Google, el cual, lo mismo que el índice en un libro impreso, ayuda a dirigirse exactamente a la información que uno está buscando.
El contenido en Internet está creciendo a pasos agigantados. Su crecimiento no es solo en el orden de tamaño y números, sino que con la proliferación de video, imágenes, noticias y actualizaciones en tiempo real, la página web promedio es cada vez más rica y compleja. Además, las expectativas de los usuarios son ahora más altas que antes; quienes realizan búsquedas desean encontrar el contenido relevante más reciente, mientras que quienes publican en la Red esperan que su contenido sea hallado en el momento en que lo publican.
Nuestro índice viejo tenía varias capas, algunas de las cuales eran actualizadas a un ritmo más acelerado que otras, y la capa principal era actualizada cada par de semanas. Para actualizar una capa del antiguo índice, analizábamos la Red completa, lo que obviamente equivalía a un retraso importante entre el momento en que encontrábamos la página y el momento en que la poníamos disponible para los usuarios.
Con el nuevo índice de búsqueda, Caffeine, Google analiza la Red en pequeñas porciones y actualiza de manera continua y globalmente. A medida que encontra nuevas páginas o nueva información en páginas ya existentes, agrega esos datos directamente al índice. Esto significa que los usuarios pueden encontrar información más reciente, como nunca antes, sin importar cuándo o dónde fue publicada.
Caffeine permite indexar páginas web a una escala enorme. De hecho, cada segundo procesa cientos de miles de páginas en paralelo. S
Caffeine pensando en el futuro. No solamente es algo nuevo, sino que además es una base robusta que hace posible que podamos construir un motor de búsqueda aún más rápido y exhaustivo que escale al ritmo del crecimiento de la información online y entregue a los usuarios resultados de búsqueda aún más relevantes.
Por: Carrie Grimes, Software Engineer
