Google Sitemaps Beta
Google Sitemaps Beta é o serviço do Google criado para agilizar a indexação de informação e aliviar o trabalho do Googlebot (software que navega pela web lendo o conteúdo das páginas web). Sintetizando bastante ele lê um arquivo XML que contém informações sobre as páginas recentemente modificadas ou criadas.
Em um site sem o Sitemaps, o Googlebot percorre todas as páginas verificando se alguma delas foi modificada ou se existe alguma página nova. Em um site que use o serviço Sitemaps, um arquivo XML já contém estas informações sobre atualizações, o buscador então tem apenas o trabalho de ler o XML e, caso alguma página tenha sido atualizada ou incluída, atualizar as informações de seu banco de dados.
Com o uso de Sitemaps, ambas as partes ganham, pois:
- O site cliente tem seus dados atualizados no Google com muito maior velocidade.
- O Google agrega valor ao seu serviço, disponibilizando as informações mais recentes e reduzindo o custo de percorrer a web em busca das páginas atualizadas.
O uso do arquivo XML de mapa do site é aconselhado para sites com atualização constante, como blogs, sites de notícias e aplicações sociais com dados públicos. Caso um site contenha apenas páginas estáticas o uso do arquivo XML torna-se desnecessário.
Mapa do site automaticamente atualizado
Para que o serviço funcione apropriadamente, o arquivo XML deve ser atualizado sempre que houver alguma modificação no site. Mesmo podendo ser feita manualmente, a atualização fica muito mais eficiente se for feita automaticamente por um programa no servidor.
O Google tem um script código livre em Python para criação de mapa do site, soluções escritas em PHP, ASP.Net, Java, podem ser facilmente encontradas na internet. Existe inclusive um plug-in para WordPress que faz um pouco mais que simplesmente atualizar o XML.
Outras informações disponibilizadas pelo serviço
Para utilizar o serviço Google Sitemaps, não é obrigatório o uso do mapa do site. O serviço pode ser utilizado também para coletar outras informações acerca do site (mesmo sem a existência do arquivo XML), algumas delas são:
- Consultas em que o site foi exibido na listagem de resultados.
- Consultas em que o site foi acessado através da listagem de resultados.
- Páginas indexadas com sucesso, listagem de eventuais erros de indexação.
- PageRank das páginas.
- Palavras mais comuns no conteúdo.
- Palavras mais comuns em links que apontam para o site.
- Arquivos mais comuns.
Excelente explicação. Configurei facilmente o meu site. Não gerei o mapa do site, mas pedi para ele usar o RSS (o sistema oferece essa opção). Estou esperando agora ele gerar os relatórios.
Percebi que as interfaces da ferramenta ainda tão muito pobres. Chegam a ser meio “toscas” em alguns casos (rs).
Não que isso faça diferença para o tipo de público que vai usar a ferramenta. Mas é que outras coisas do Google são bem menos feias, como o Google Analytics, por exemplo. =)
Eu tive um sério problema com o script python do google o mapa saia todo errado… google não atualiza o script desde 2005 tá precisando de uma séria reforma