Writing About, análise semântica do Twitter

O Writing About analisa os twitts de um usuário e diz sobre que assuntos ele tem postado ultimamente.

Tela de resultado do Writing About

Acabo de desenvolver uma ferramenta que identifica palavras-chave no Twitter e classifica-o segundo uma árvore de categorias personalizada. Não é uma comparação direta do tipo “encontre termos relacionados com tecnologia”, há uma análise do significado das palavras do texto.

Teste agora mesmo o serviço de análise semântica do Twitter!

É meu mais recente projeto de uma madrugada, por enquanto ele não tem utilidade real para usuários, é apenas uma prova de conceito. Em breve pretendo liberar o acesso ao serviço na forma de API JSON[bb], com isso outros progamadores poderão usá-lo pra criar aplicativos que usem a interpretação dos twitts dos usuários.

Exemplo de aplicação que pode ser desenvolvida a partir da API do Writing About:

Recomendação de conteúdo a partir do que você tem tuitado: A aplicação analisa as categorias e palavras-chave dos seus twitts mais recentes e te recomenda conteúdo que pode te interessar.

Milestone a ser cumprido antes de liberar API pública:

Suportar no mínimo mil requests por hora. Atualmente o Twitter aceita no máximo 100 consultas por hora, com esse limite fica impossível usar o Writing About pra algo com um mínimo de escala. O ideal seriam 100 requests por minuto.

>> tech stuff

O Writing About

  • foi desenvolvido em uma madrugada
  • é programado em Python[bb]
  • roda na infraestrutura do Google App Engine
  • usa a API do Twitter pra pegar os posts mais recentes do usuário
  • usa API externa pra análise semântica, ainda não posso dizer que API é, direi assim que for autorizado
  • todas as consultas são gravadas num log no não-SQL App Engine datastore. Não-SQL é um sistema de armazenamento de dados não relacional e livre de schema, projetado especialmente para aplicações web de alta escala e grande volume de dados
  • não tem tratamento de erros, porque sou afobado e queria mostrar logo pra vocês :)

Copyright boo-box 2009.