A revista Newsweek, de
16 de junho de 2017, trouxe uma reportagem inquietante sobre Big Data,
manifestada na sua capa. “Como Big Data
está corrompendo a democracia, via a lavagem cerebral”. Estava aqui nos EUA, saindo
do DGIQ-Data Governance & Information Quality, onde os assuntos “dados” e
privacidade foram amplamente discutidos. “Big Data”, foi um tema muito tratado nas
sessões mais tecnológicas, das quais participei, e “Privacidade”, de forma
colateral, foi destaque nas sessões mais
focadas em GDPR-A Regulação da União Europeia sobre proteção aos dados. Claro
que resolvi mergulhar na reportagem da revista, escrita em 12 páginas, pela
importância do tema. Abaixo a síntese do que observei:
a)As coisas começaram
pela suspeita de que a eleição de Trump tenha sido ganha, em parte, devido à
ação da sua equipe digital, comandada por seu genro, Jared Kushner, hoje chefe
do Escritório de Tecnologia e Inovação do Governo Americano. Ele, depois de um
curso no FB(FaceBook), montou um forte time de especialistas para trabalhar o
perfil dos quase 220 milhões de eleitores, que segundo dizem, está disponível
nos Data Lakes de Zuckerberg. Nessa mina de ouro, há informações sobre o
eleitorado americano, com detalhes maiores do que seríamos capazes de imaginar.
Os dados dariam uma formidável possibilidade de estudos analíticos, passíveis
de produzirem detalhes sobre comportamento, pensamento e emoções de todos os
americanos e dos “facebuqueiros” do planeta. Já existiria uma ferramenta para
tal, capaz de analisar os milhares de “data points” que cada um de nós teríamos
nos Data Lakes gigantescos do FB.
b)A primeira suspeita
surgiu numa apresentação, antes da eleição, feita por uma empresa, acerca de um
produto chamado “Cambridge Analítica”, originado de estudos/pesquisas de
AI(Inteligência Artificial) e desenvolvido na famosa Universidade que lhe dá
parte do nome . O produto da classe dos “Analytics” seria capaz de produzir o
que chamam de “perfil psicográfico”, onde certas dimensões da nossa “forma de
ser e pensar” seriam detectadas pela análise do “Likes” que damos, ou pelos
livros que lemos, ou dos dados que mostramos, por espontaneidade ou por indução.
Na demonstração, foi feita uma análise com drill-down, a partir de um conjunto
de dados de pessoas selecionadas e gradativamente sendo segmentado em conjuntos
menores e mais focados, que por sua vez dariam origem a outros sempre com um
foco refinado, até chegar num certo indivíduo específico. Isso se chama
microtargeting e já é usado em outros campos, inferindo consumos e hábitos de
internautas no mundo do marketing digital. No caso da aplicação política, o
objetivo (foi) é criar um mecanismo de identificação de grupos de pessoas que
possam ser persuadidas por mensagens que lhes falem de forma mais
significativa. Se não para comprarem seus produtos, mas para “comprarem” ideias
e aderirem aos candidatos “digitais” em eleições.
c)Segundo a reportagem,
teoricamente as pessoas podem ser subdivididas em 2 grandes grupos gerais: As
emotivas e as cognitivas. As emotivas são as mais susceptíveis a argumentos que
lhes tocam em pontos vitais da camada emocional e são deixadas levar mais
facilmente por ações de convencimentos (por exemplo, alguém que se vê
“incomodado” com o excesso de estrangeiros no pais e tem uma tênue prevenção
contra imigrantes, recebe um posicionamento de um candidato com forte propensão
à criação de barreiras à migração. Bingo!). Os outros seriam os cognitivos,
aquelas pessoas que, julgam ou decidem por aspectos de cognição(conhecimentos)
e são mais resistentes à e-mails/propagandas de sedução fácil. Aplicam sempre
um filtro mais racional antes de darem um passo. Essa é a base da segmentação desejada por
partidos políticos para poderem criar as táticas de persuasão digital, com a
lupa do microtrageting apontada para as devidas camadas, sobre as quais desejam
interferir.
d)A aplicação do sistema
Cambridge Analytica foi baseada em algoritmos de “Cluster Analysis” já usados
há anos pela IA(Inteligência artificial), principalmente no foco de segmentação
de clientes por hábitos de compras e preferências. A Universidade de Cambridge
não confirma a derivação do produto aplicado nas análises do Partido
Republicano(vencedor), mas oferece , no seu site, um link para que você a experimente no seu perfil. O repórter do
Newsweek autorizou a análise do seu perfil de FB e eu também fui experimentar. Ao
final deste artigo, mostrarei, alguns pontos sobre como que a inteligência
artificial me avaliou dentro dos conceitos de perfis psicográficos. A
ideia é entender as pessoas, baseadas nos seus dados no FB, procurando as
tendências psicológicas descritas no acrônimo OCEAN: Openness(abertura), Conscientiousness
(consciência), Extraversion(extroversão), Agreableness(concordância) e Neuroticism(instabilidade
emocional ). Antes de analisar o “OCEAN” do eleitorado, a equipe de Trump teria enriquecido o Banco de
dados de 220 milhões de americanos com informações de registros de votação,
registro de propriedade de armas, histórias de compras por cartões de créditos,
além de outros trazidos de fontes monolíticas de dados como Experian(no Brasil,
Serasa-Experian),Data Logix(grande rastreadora de hábitos de consumo, hoje
pertencente à Oracle),Epsilon(outra gigante que fornece dados para aplicações
de marketing direcionado)e Axciom, talvez a maior empresa americana em coleta e
tratamento de dados.Com esse poder de fogo, foi montado o Projeto Alamo, que
pode ter direcionado a virada de jogo na campanha de 2016, com a vitória de
Trump. Os Republicanos não foram os primeiros(os democratas já haviam tentado
algo, via Catalist), mas foram aqueles que cruzaram o poder de fogo do
Lookalike do FB(busca por pessoas com hábitos e jeitos semelhantes aos seus
amigos/clientes, mas que ainda não são) com o microtargeting. Assim, a campanha
de Trump pôde estender seus tentáculos para assuntos considerados normalmente
fora da “Overton Windows”, protocolo político contendo uma lista de assuntos
considerados “politicamente incorretos” e que não devem ser tratados
diretamente em discursos e políticas governamentais (sic).
e)Em resumo, segundo a
Newsweek, na eleição de 2016, a Inteligência artificial com Big Data permitiu que conceitos cinzentos como (sentimentos de racismo, supremacia branca,
restrições a refugiados, antissemitismo e misoginia violenta) alcançassem targets
simpáticos de forma direta, porém silenciosa. Tudo pelos efeitos dos algoritmos
de mineração e dos exabytes armazenados sobre nós. Para 2020 prevê-se que esses algoritmos estarão
mais refinados e a produção destas mensagens focadas alcançará um nível de
automação infinitamente maior, quando centenas e milhares delas serão
produzidas e distribuídas. Essa é a teoria desenvolvida no artigo da Newsweek,
e que coloca o conceito de Big Data com analytics, cada vez mais na alça de
mira da proteção dos dados, com segurança e respeito à privacidade. No futuro,
a ética dos dados também deverá ser foco da Gestão e Governança de dados. Nunca
governar os seus dados se tornou tão
crítico...
e)Os resultados
apresentados pelo algoritmo supostamente “base” do produto Cambridge Analytica,
quando entrei com meu ID do FB e o autorizei foi:
Gênero Psicológico:
A IA sugere que meu
perfil digital é bastante andrógino. Sugere que eu seja do sexo
Feminino(sic!!), mas que não reprimo meu lado masculino(sic!!!). Abaixo ele dá
uma dica do porquê: Os livros nos quais dei “Like”. Interessante que ele me
transforma em (mais feminino) por causa de um Like dado no filme “The boy in the striped pyjama”. Um drama da guerra que
fala sobre a amizade de dois meninos num campo de concentração!. Acho que o
algoritmo se “embolou” quando analisou as palavras “boy” and “pyjamas”.....
Agora a interpretação
dos 5 pontos a minha personalidade:
Resumo da ópera:
Alguns pontos de acerto
e muitos erros foram cometidos pelos “engines” de inferências oferecidos para
teste, no meu caso. Nada que um horóscopo não faça, com a mesma precisão, nos
jornais diários. Você pode experimentar o seu perfil psicográfico, acessando ApplyMagicSauce.com e autorizando o acesso ao seu perfil do FB.
Mas não se assuste. Uma coisa é existir zetabytes de informações sobre nós.
Outra coisa, é a ferramenta ter a capacidade inferencial refinada para
interpretá-los, levando a estatística à uma quase adivinhação digital. Talvez
numa assinatura “premium” do produto, os algoritmos aplicados sejam bem mais
precisos...