Marco Gomes

Geek, imigrante, nerd, cristão, biker. Founder da boo-box (vendida) e do Heartbit. Consigliere do JovemNerd

#DataScience: 3 lições do meu primeiro ano trabalhando com dados em Nova York

Publicado em 2017-07-24

3 lições que aprendi no dia-a-dia da empresa que usa dados para resolver os problemas mais complexos de algumas das mais importantes organizações do mundo.

Recentemente completei um ano trabalhando com data science em Nova York para uma startup do Vale do Silício, num dos mercados mais competitivos do planeta. Eu não trabalho com invenção e implementação de algoritmos complexos – apesar de lidar com este tema frequentemente –, meu papel é no desenvolvimento de negócios, estratégia de implantação, o famoso “business development”. Deixando claro que esta é minha perspectiva, trago a vocês algumas lições de negócios em grandes (enormes!) projetos de dados nas organizações mais importantes do mundo.

Lição 1: Integração geral normalmente causa mais impacto que pequenos focos de super-algoritmos e machine learning

O problema de dados mais comum em uma organização não é entender os dados, mas integrar as múltiplas fontes e plataformas. Mesmo numa startup pequena, como eram as minhas no Brasil, a informação fica espalhada em inúmeros sistemas, ambientes e planilhas, como Google Analytics, Mailchimp, Salesforce, Oracle, DB2, Google Spreadsheets, Microsoft Excel e tantos outros. Para uma grande organização (e para uma pequena também), integrar todos estes dados num ambiente único e centralizado, com o devido controle de permissões, é mais valioso que aplicar um algoritmo de machine learning otimizando apenas o histórico de vendas, por exemplo. Há bastante ineficiência no fluxo de informação dentro de uma grande organização, e ineficiência pode ser traduzida como dinheiro sendo queimado. Melhorar o fluxo de informação geral dentro de uma corporação cria mais valor que otimizar apenas um pequeno setor.

Lição 2: <cliche>Data Science é sobre pessoas</cliche>

Numa grande organização, você lida primariamente com pessoas, não com máquinas e sistemas. São as pessoas que tomam decisões baseadas no que vêem nos dados, ao aplicar um novo algoritmo super sofisticado numa tabela com 1 bilhão de registros, o output (saída, resultado) precisa ser simples o suficiente para ser entendido e ter valor suficiente para valer a mudança de hábito da pessoa que vai consumir aquela informação. Neste sentido, minha experiência com user interface e user experience se mostrou altamente valiosa, apresentar gráficos bem construídos, painéis de controle fáceis de entender, e aplicações eficientes, impacta diretamente em como uma pessoa entende, valoriza e usa recorrentemente o resultado de um trabalho de data science.

Lição 3: Mudar hábitos exige enorme investimento de energia

Fazendo softwares para as massas e lendo (material introdutório) sobre psicologia e ciência cognitiva eu aprendi muito mais sobre o sucesso de projetos de data science que estudando data science em si. Implementar um novo ecossistema de dados numa organização – por exemplo ao integrar 28 fontes de dados e 1 trilhão de registros contendo 10 anos de informação histórica – é um trabalho enorme, mas eu diria que esforço tão grande quanto é fazer um pequeno grupo – que seja uma dúzia de pessoas –, com diferentes trajetórias profissionais e formações, abandonarem seus antigos hábitos, planilhas, emails, e passarem a usar o novo fluxo de trabalho em uma ferramenta que eles nunca viram. Existe sempre o “mas antes estava funcionando”, e o desafio é mostrar que o novo jeito vai trazer mais produtividade e precisão no resultado do trabalho, liberando tempo das equipes para lidar com outras atividades que um sistema automatizado ainda não consegue fazer.

O mercado é menos ficção-científica e mais negócios

Todos os desafios humanos envolvidos numa venda de carro usado estão também envolvidos em implementar um projeto de data science. As pessoas têm vícios, preferências, jogo de poder, simpatia ou antipatia e tudo mais que define as relações humanas desde que decidimos descer das árvores e nos organizar em grupos. Entender este aspecto fundamental do desenvolvimento de negócios pode te ajudar a ter muito mais sucesso em projetos, sejam eles de data science ou venda de picolé.

Vista aérea de Manhattan, NY, com sobreposição de linhas azuis pelas ruas, representando fluxo de informação


Sobre o autor: Marco Gomes, reconhecido em 2014 pela revista Forbes como um dos 30 jovens com menos 30 anos mais promissores do país, foi premiado como O Melhor Profissional de Tecnologias de Marketing do Mundo pela World Technology Network; foi o fundador da boo-box, apontada como uma das empresas de publicidade mais inovadoras do mundo pelas revistas Fast Company e Forbes, vendida em 2015 para a FTPI Digital; e co-fundador do Heartbit / Mova Mais, app de saúde listado pela revista Consumidor Moderno como uma das 100 empresas mais inovadoras do Brasil. O profissional fez educação executiva em Gerenciamento de Marketing Estratégico na Universidade de Stanford, Califórnia, e já palestrou na sede da ONU, em Nova York, sobre Economia Criativa e Liberdade de Expressão na Internet.

Textos relacionados:

Deixe sua opinião

6 comentários

  1. Sillas Gonzaga comentou:

    Poderia recomendar algumas leituras de psicologia e ciência cognitiva?

  2. Bob comentou:

    “[…] Para uma grande organização (e para uma pequena também), integrar todos estes dados num ambiente único e centralizado, com o devido controle de permissões, é mais valioso que aplicar um algoritmo de machine learning otimizando apenas o histórico de vendas, por exemplo. […]”

    Esse trecho me deixou muito interessado, acho que daria uma bela pesquisa.

  3. Marcelo Mendes de Assis comentou:

    Poderia recomendar algumas leituras de psicologia e ciência cognitiva? [2]

  4. Vinícius comentou:

    Dia a dia perdeu o acréscimo de hífen desde a reforma ortográfica. Ademais, o que encontrei é muita informação repetida. Percebo que o mercado atual está saturado de “reprodutores”, faltando alguém que realmente “crie” coisas inovadoras. Saturado desse tipo de conteúdo.