Estreia o Caffeine, novo sistema de indexação web da Google

10/06/2010

Com a tecnologia, empresa promete resultados 50% mais atualizados, com itens listados quase instantaneamente após sua publicação na Internet.

O Google anunciou nesta terça-feira (8/6) o início das operações do Caffeine, seu novo sistema de indexação da web. Com o sistema, os resultados das buscas serão 50% mais atualizados em comparação com a tecnologia anterior, afirma a empresa.
 
Anunciado em agosto de 2009, o sistema foi disponibilizado inicialmente em caráter de teste - fase que terminou em novembro do ano passado.
 
Em seu blog, a empresa explica por que investiu em um novo sistema de indexação. "O conteúdo na web está explodindo", conta a engenheira de software Carrie Grimes. "E cresce não apenas em tamanho e números mas com o advento de vídeo, imagens, notícias e atualizações de tempo real."
 
"Além disso, a expectativa das pessoas por resultados de busca é cada vez mais alto. Quem faz a pesquisa espera encontrar os conteúdos relevantes mais recentes, e quem publica espera ser encontrado instantaneamente, logo após a publicação", diz Grimes.
 
A Google conta que, com o velho sistema de indexação baseado em camadas, alguns índices eram atualizados mais lentamente que outros, dependendo de sua posição nas camadas. "A camada principal poderia ser atualizada a cada duas semanas", explica.
 
O sistema Caffeine analisa a web em "pequenos pedaços" e atualiza o índice de busca de forma contínua, globalmente. "Quando encontramos novas páginas, ou novas informações em páginas existentes, podemos inseri-las diretamente no índice", conta a engenheira. Como resultado, os resultados de buscas tornam-se mais frescos.
 
A cada segundo, explica a empresa, o sistema de indexação do Caffeine processa "centenas de milhares de páginas em paralelo". O Caffeine ocupa um banco de dados com cerca de 100 milhões de gigabytes, e acrescenta novas informações a uma taxa de "centenas de milhares de gigabytes por dia".

"Nós construímos o Caffeine com o futuro em mente", explica a engenheira. "Ele não é apenas mais atualizado; é uma fundação robusta que torna possível, para nós, construir um motor de busca mais rápido e abrangente, que acompanha o crescimento do volume de informação online."

Site: IDG Now!
Data: 09/06/2010
Hora: 0h25
Seção: Internet
Autor: ------
Link: http://idgnow.uol.com.br/internet/2010/06/09/estreia-o-caffeine-novo-sistema-de-indexacao-web-da-google/