Writing About, análise semântica do Twitter
O Writing About analisa os twitts de um usuário e diz sobre que assuntos ele tem postado ultimamente.
Acabo de desenvolver uma ferramenta que identifica palavras-chave no Twitter e classifica-o segundo uma árvore de categorias personalizada. Não é uma comparação direta do tipo “encontre termos relacionados com tecnologia”, há uma análise do significado das palavras do texto.
Teste agora mesmo o serviço de análise semântica do Twitter!
É meu mais recente projeto de uma madrugada, por enquanto ele não tem utilidade real para usuários, é apenas uma prova de conceito. Em breve pretendo liberar o acesso ao serviço na forma de API JSON, com isso outros progamadores poderão usá-lo pra criar aplicativos que usem a interpretação dos twitts dos usuários.
Exemplo de aplicação que pode ser desenvolvida a partir da API do Writing About:
Recomendação de conteúdo a partir do que você tem tuitado: A aplicação analisa as categorias e palavras-chave dos seus twitts mais recentes e te recomenda conteúdo que pode te interessar.
Milestone a ser cumprido antes de liberar API pública:
Suportar no mínimo mil requests por hora. Atualmente o Twitter aceita no máximo 100 consultas por hora, com esse limite fica impossível usar o Writing About pra algo com um mínimo de escala. O ideal seriam 100 requests por minuto.
>> tech stuff
- foi desenvolvido em uma madrugada
- é programado em Python
- roda na infraestrutura do Google App Engine
- usa a API do Twitter pra pegar os posts mais recentes do usuário
- usa API externa pra análise semântica, ainda não posso dizer que API é, direi assim que for autorizado
- todas as consultas são gravadas num log no não-SQL App Engine datastore. Não-SQL é um sistema de armazenamento de dados não relacional e livre de schema, projetado especialmente para aplicações web de alta escala e grande volume de dados
- não tem tratamento de erros, porque sou afobado e queria mostrar logo pra vocês :)
Copyright boo-box 2009.
