Google Sitemaps Beta

Google Sitemaps Beta é o serviço do Google criado para agilizar a indexação de informação e aliviar o trabalho do Googlebot (software que navega pela web lendo o conteúdo das páginas web). Sintetizando bastante ele lê um arquivo XML que contém informações sobre as páginas recentemente modificadas ou criadas.

Em um site sem o Sitemaps, o Googlebot percorre todas as páginas verificando se alguma delas foi modificada ou se existe alguma página nova. Em um site que use o serviço Sitemaps, um arquivo XML já contém estas informações sobre atualizações, o buscador então tem apenas o trabalho de ler o XML e, caso alguma página tenha sido atualizada ou incluída, atualizar as informações de seu banco de dados.

Com o uso de Sitemaps, ambas as partes ganham, pois:

  • O site cliente tem seus dados atualizados no Google com muito maior velocidade.
  • O Google agrega valor ao seu serviço, disponibilizando as informações mais recentes e reduzindo o custo de percorrer a web em busca das páginas atualizadas.

O uso do arquivo XML de mapa do site é aconselhado para sites com atualização constante, como blogs, sites de notícias e aplicações sociais com dados públicos. Caso um site contenha apenas páginas estáticas o uso do arquivo XML torna-se desnecessário.

Mapa do site automaticamente atualizado

Para que o serviço funcione apropriadamente, o arquivo XML deve ser atualizado sempre que houver alguma modificação no site. Mesmo podendo ser feita manualmente, a atualização fica muito mais eficiente se for feita automaticamente por um programa no servidor.

O Google tem um script código livre em Python para criação de mapa do site, soluções escritas em PHP, ASP.Net, Java, podem ser facilmente encontradas na internet. Existe inclusive um plug-in para WordPress que faz um pouco mais que simplesmente atualizar o XML.

Outras informações disponibilizadas pelo serviço

Para utilizar o serviço Google Sitemaps, não é obrigatório o uso do mapa do site. O serviço pode ser utilizado também para coletar outras informações acerca do site (mesmo sem a existência do arquivo XML), algumas delas são:

  1. Consultas em que o site foi exibido na listagem de resultados.
  2. Consultas em que o site foi acessado através da listagem de resultados.
  3. Páginas indexadas com sucesso, listagem de eventuais erros de indexação.
  4. PageRank das páginas.
  5. Palavras mais comuns no conteúdo.
  6. Palavras mais comuns em links que apontam para o site.
  7. Arquivos mais comuns.