Google Tag Manager

quinta-feira, 10 de junho de 2010

O blog do Google Brasil

O blog do Google Brasil

O novo índice de pesquisa do Google: Caffeine


Anunciamos esta semana a finalização de um novo sistema de índice de pesquisa chamado Caffeine. Comparado ao nosso sistema anterior, o Caffeine oferece resultados 70% mais atualizados para as pesquisas na web. Além disso, é o maior acervo de conteúdo na web que já oferecemos. Não importa se é uma notícia ou uma postagem em um blog ou fórum: com o Caffeine você pode encontrar links para conteúdos relevantes após a publicação mais rápido do que nunca.

Uma explicação para aqueles que, diferente de nós, não vivem do desenvolvimento de mecanismos de pesquisa: quando você pesquisa no Google, você não pesquisa a web real. Em vez disso, você pesquisa o índice da web do Google, que funciona como o índice no final de um livro, ajudando você a encontrar exatamente o que precisa. (Aqui está uma boa explicação (site em inglês) sobre como isso funciona.)

Então, por que desenvolvemos um novo sistema de índice de pesquisa? O conteúdo na web está cada vez maior. E o crescimento não é apenas em tamanho e números. Com o advento dos vídeos, imagens, notícias e atualizações em tempo real, as páginas comuns estão cada vez mais ricas e complexas. Além disso, as expectativas das pessoas com relação à pesquisa também estão maiores. Quem pesquisa quer encontrar o conteúdo relevante mais atualizado possível, e quem publica o conteúdo também quer que ele seja encontrado instantaneamente.

Nós desenvolvemos o Caffeine para acompanhar a evolução da web e atender às expectativas dos usuários, que estão cada vez maiores. Para que você entenda melhor as novidades, a imagem abaixo ilustra as diferenças do nosso antigo sistema de índice em comparação ao Caffeine:


Nosso índice antigo tinha várias camadas, e algumas eram atualizadas mais frequentemente do que outras. A camada principal era atualizada a cada duas semanas. Para atualizar uma camada do índice antigo, nós analisávamos toda a web, o que criava um atraso significativo entre o momento em que encontrávamos uma página e o momento em que ela ficava disponível para você.

Com o Caffeine, nós dividimos a análise da web em partes pequenas, e atualizamos nosso índice de pesquisa continuamente e no mundo todo. Quando encontramos novas páginas ou novas informações em páginas existentes, podemos adicioná-las diretamente ao índice. Isso significa que você pode encontrar informações mais atualizadas do que nunca, independente de quando ou onde foram publicadas.

Com o Caffeine, nós podemos indexar páginas da web em escalas enormes. Na verdade, o Caffeine processa, de maneira simultânea, centenas de milhares de páginas a cada segundo. Se isso fosse uma pilha de papel, aumentaria quase cinco quilômetros a cada segundo. O Caffeine reúne cerca de 100 milhões de gigabytes de armazenamento em um banco de dados, e insere diariamente centenas de milhares de gigabytes de informações. Você precisaria de 625 mil iPods com capacidade máxima para armazenar tanta informação; se fosse uma pilha de papel, teria quase 65 quilômetros de altura.

Nós desenvolvemos o Caffeine com o futuro em mente. Não é apenas um sistema atualizado, é uma base robusta que nos permitirá desenvolver um mecanismo de pesquisa ainda mais rápido e completo, capaz de acompanhar o crescimento das informações on-line e de entregar resultados ainda mais relevantes para suas pesquisas. Por isso, não deixe de acompanhar mais aprimoramentos durante os próximos meses.


Postado por: Carrie Grimes, engenheira de software Share/Bookmark

LinkWithin

Related Posts with Thumbnails

Marque uma consulta comigo

Agenda