Como funciona a segmentação de audiência na publicidade online e sua importância na evolução da Web

As técnicas modernas de segmentação de audiência coletam dados anônimos em inúmeros ambientes, com isso as propagandas online ficam mais relevantes sem comprometer nossa privacidade.

Placa de aeroporto com as palavras "Online Ads Money"

O poder de segmentação da publicidade online contribui para o desenvolvimento da Internet, pois anunciantes fazem propagandas com melhor retorno sobre o investimento, quem publica conteúdo na Internet recebe mais dinheiro pelos anúncios exibidos para sua audiência e os consumidores usam uma internet mais agradável, com anúncios mais relevantes e interessantes. Melhorar a Internet através da Publicidade é a missão da boo-box, empresa de anúncios em blogs, sites e redes sociais que fundei em 2006.

Com as recentes mudanças nos termos de uso do Instagram, surgiu uma discussão muito interessante sobre a privacidade na Internet e o uso de informações pessoais em anúncios. Um aspecto muito interessante é o total desconhecimento do público geral sobre as técnicas usadas atualmente para segmentação de audiência em campanhas de publicidade, as pessoas ainda acham que a publicidade online é segmentada com base em amostragens estatísticas, como acontece na velha mídia das revistas, jornais e TV aberta. Mas por aqui não é assim.

Ao contrário de seus ancestrais analógicos, a publicidade online tem um poder de segmentação inédito e altamente escalável, neste humilde texto, pretendo cobrir algumas das técnicas mais recentes envolvendo análise de comportamento, compartilhamento de informação entre celulares e desktops, rastreamento de consumo de conteúdo e mineração de dados não-identificáveis.

Não vou discutir o caso instagram especificamente, pois ele já foi amplamente debatido e analisado (vejam estes textos do New York Times, The Atlantic e do blog oficial do Instagram sobre o assunto).

O mais importante: tudo que eu descrever aqui está supersimplificado, não há espaço nem intenção de aprofundar o leitor no assunto, portanto, considere tudo como uma aproximação da real complexidade do assunto. E por complexidade, não imagine complicação, mas capacidade, se eu digo que X é possível, imagine você que existem inúmeras variações criativas do uso de X que não estão descritas no texto.

Lição número zero: A publicidade online é baseada na construção de perfis de cada indivíduo (inclusive você que está lendo este texto)

Na publicidade offline, normalmente escolhe-se o veículo de publicidade pelo perfil da audiência aferido através de pesquisas de amostragem estatística. Faz-se uma pesquisa na rua, com pessoas de colete amarelo e pranchetas nas mãos te perguntando: Quantas TVs você tem em casa? Quantas geladeiras? Qual sua escolaridade? Que revistas costuma ler? Quantas vezes por mês? Com base nessas informações o veículo (revista, jornal, programa de TV etc) faz um perfil de sua audiência e apresenta isso aos anunciantes interessados.

Na publicidade online, o perfil de cada pessoa é feito em tempo real, de acordo com dados individuais, incluindo informações de comportamento e de consumo de conteúdo. Por comportamento imagine inúmeras informações, normalmente anônimas, do usuário: tempo de uso da página; velocidade de conexão; resolução da tela; sistema operacional do computador; versão e nome do navegador; plugins instalados; localização geográfica de país, estado, cidade e até bairro. São usadas também informações sobre o site que está sendo acessado, como idioma do texto; complexidade gramatical; assunto discutido; palavras-chave do texto; popularidade da página em buscadores; palavra-chave usadas no buscador que levam a audiência até esta página; imagens presentes na página; reputação do autor; entre outras.

As informações da página, associadas às informações do usuário, formam um perfil anônimo do indivíduo. Redes sociais podem adicionar a este perfil anônimo informações identificáveis, como nome, foto, endereço e qualquer outro dado que a audiência tenha disponibilizado e estejam cobertas nos Termos de Uso da rede social.

Portanto, enquanto na mídia offline 2 pessoas podem ser “iguais” por terem os mesmos eletrodomésticos e lerem revistas parecidas, na mídia online cada pessoa é única e tem propaganda segmentada para ela individualmente.

Os botões de redes sociais estão espalhados pela web por um motivo: coleta de dados

Todos os botões like, tweet, +1, addThis das páginas que você visita na Internet não estão lá para você clicar neles e recomendar o conteúdo, do ponto de vista da publicidade, isso é a função secundária. O principal motivo da existência dos botões de compartilhamento em redes sociais é a coleta de dados de comportamento de usuário. A pessoa nem precisa clicar neles, a simples exibição do botão em uma webpage o permite coletar dados de comportamento do usuário naquela página. Da mesma forma, todos os widgets ou linhas HTML <;script>; das páginas da Internet têm potencialmente a mesma capacidade: analisar o comportamento do usuário.

Se uma mãe nunca publicou no Facebook que está grávida, mas fez buscas no Google sobre gestação e caiu em blogs sobre o assunto com botões de like do Facebook, a rede social sabe deste novo interesse da usuária. Quando ela entrar no Facebook para conversar com seus amigos, a rede social vai cruzar os dados históricos daquela usuária e vai descobrir que é a mesma pessoa que estava buscando por assuntos de gravidez alguns dias (ou horas) atrás, exibindo anúncios mais relevantes para a recém-descoberta grávida.

Ambientes logados transportam informações entre plataformas

Se você está logado no Google no navegador do celular e faz uma busca sobre “Revista em Quadrinhos”, o Google sabe que o usuário NNNN se interessa por este assunto e pode transportar isso para todas as plataformas em que atua, como TV, desktop, laptop, celular. Quando você acessar seu Gmail no laptop, o Google recupera o histórico de interesses e pode te apresentar propagandas de revistas em quadrinhos. Quando você for assistir um vídeo na sua Google TV, ele recupera essa informação e usa novamente, ao mesmo tempo que analisa seu comportamento na Google TV para exibir anúncios no celular e assim por diante. Ao ler seus e-mails no Gmail, o Google analisa seus interesses e conteúdos de conversas com amigos, incrementando seu perfil de interesses, e pode usar essa mesma informação quando você acessa um blog que tem links patrocinados do Ad Sense.

Esse transporte de informações entre plataformas pode acontecer em qualquer ambiente logado, como Facebook, Google, Amazon, Twitter etc.

Toda informação pública é usada na segmentação de pessoas

O carro do Google Street View (aquele que tira fotos das ruas de grandes cidades brasileiras) também armazena informações sobre todas as redes Wi-Fi que encontra, abertas ou fechadas e sua localização geográfica. A Apple também faz isso usando os iPhones de todos nós, sempre que você está com o Wi-Fi ligado e o GPS também, ele envia para uma central a informação de quais redes estão ao seu alcance e qual sua localização GPS, com isso, armazena que as redes “Cheia de vírus” e “República dos Virgens” estão na região da rua Carolina Morelli, em Alto de Pinheiros, São Paulo, SP.

Tela de iPhone pedindo para ligar o Wi-Fi para melhorar a localização
Nossos celulares pedem para ligarmos o Wi-Fi pois, mesmo sem se conectar a nenhuma rede, ele sabe a localização geográfica do aparelho pelas redes que estão próximas.

Com isso, Google e Apple sabem que, se algum dispositivo enxergar as redes Wi-Fi “Cheia de vírus” e “República dos Virgens”, está na região da rua Carolina Morelli, em Alto de Pinheiros, São Paulo, SP. O dispositivo nem precisa se conectar à rede Wi-Fi citada, basta que detecte as informações das redes próximas para que o cruzamento de dados seja feito e a localização definida. A Apple chama isso de Maps location-based service, presente inclusive em dispositivos sem GPS, como o iPod Touch e iPad de 1ª geração sem GPS.

Ao fazer uma busca na Internet por “como tocar gaita” e acessar um blog que usa boo-box (este e outros 370 mil), o sistema de segmentação de anúncios da boo-box agrega esta informação ao seu perfil anônimo e não-identificável e passa a te exibir anúncios mais relevantes por semanas, até meses, dependendo dos resultados gerados pelo seu comportamento. Como você está sempre buscando assuntos na Internet, usando redes sociais e acessando sites independentes, o mecanismo de segmentação de anúncios da boo-box vai ficando cada vez mais preciso, te recomendando publicidade cada vez melhor segmentada, de acordo com seu comportamento online. Fazemos isso em média 400 vezes por segundo usando 32 servidores dedicados e mais uma complexa infraestrutura em nuvem e CDN, gerando um log de 20 GB por dia. Lembrando que a boo-box trabalha apenas com perfis anônimos e não-identificáveis, não há acesso a endereços, nomes, e-mails, fotos, nem nada parecido.

A novidade: Browser fingerprint

Mesmo que você desabilite cookies e limpe caches, seu navegador tem informações únicas, uma combinação de versões de softwares, plugins, add-ons, idioma e muitas outras informações tornam a sua máquina potencialmente única, fazendo desnecessário o uso de cookies para identificação e rastreamento. O mesmo acontece, como vimos acima, se você estiver logado em uma rede social, mesmo sem cookies e com caches limpos, a rede social vai te segmentar usando seu cadastro.

Até o preço dos produtos pode flutuar de acordo com seu perfil

Não existe limite para o que é possível fazer com tecnologia. Se você está em um computador popular, com uma resolução de tela menor, navegador antigo, conexão com a internet de pouca velocidade e acessando de um bairro afastado do centro, o varejista de pacotes de turismo pode detectar tudo isso automaticamente e fazer um preço especial para você, “compre agora e tenha 20% de desconto” por exemplo. No Brasil esta prática ainda não é oficialmente adotada por ser potencialmente ilegal, mas tudo pode mudar com um bom advogado.

Existem mercados de negociação das informações anônimas de segmentação de usuários

Você está em um e-commerce, escolheu um produto, colocou no carrinho e desistiu de comprar? Você demonstrou interesse em um produto. Um concorrente do e-commerce que você acaba de rejeitar pode comprar a informação da sua intenção de compra e passar a te oferecer anúncios de produtos semelhantes ou iguais, inclusive com “compre agora com 20% de desconto!”. Toda essa negociação acontece em tempo real, sem interferência humana, normalmente em poucos milissegundos.

Taxa de erro

Todas as técnicas brevemente descritas acima têm uma taxa de erro, nem sempre um computador é usado apenas por uma pessoa, nem sempre o browser fingerprint vai ser único, nem sempre o celular vai estar com o Wi-Fi habilitado para ser localizado mesmo sem antena GPS. Mas o histórico de mercado mostra que, usando estas técnicas de segmentação, o retorno sobre o investimento das campanhas de propaganda é melhor e a segmentação de publicidade fica muito mais interessante para a audiência. Resumindo: É melhor usar que não usar.

A privacidade do usuário e o controle da segmentação na Web

Se você chegou até aqui, pode estar preocupado com sua privacidade, mas não se assuste! O mais importante é que o usuário tenha a opção de limpar o histórico facilmente e fazer opt-out do rastreamento, por exemplo com o modo de navegação privada no browser. Ao fazer opt-out da segmentação online sua navegação pela internet vai ficar cheia de anúncios irrelevantes e desinteressantes, mas o controle deve estar em suas mãos, não dos anunciantes.

Não se preocupe, se a segmentação é feita com informações não identificáveis (sem foto, sem nome, sem endereço), você só tem a ganhar: Com uma publicidade mais interessante e relevante a internet fica melhor para você e para todo mundo!

Imagem via Shuttersock.