Total de visualizações de página

domingo, 5 de novembro de 2017

Governança/Gestão e a ética em dados-Parte 2


Nessa parte discutiremos, com detalhe, alguns conceitos que diretamente podem afetar o senso de ética no uso dos dados. Esses pontos, depois de devidamente analisados, deverão compor Princípios e Políticas(2 dos P´s da GD) de dados das empresas, caso as empresas considerem pertinentes, com a chegada dos movimentos de Big Data,IoT, etc.
Alguns fatores são muito importantes de serem considerados, quando pensamos em ética sobre os dados. Por exemplo:

a-Propriedade dos dados
b-Privacidade dos dados
c-Proteção dos dados(anonimato)
d-Validade dos dados
e-Corretude e equidade dos algoritmos usados na análise

Embora discutidos em separado, esses fatores se entrelaçam, na medida em que o conceito de privacidade, por exemplo, pode ser afetado pelo senso controverso de propriedade dos dados ou pela validade dos dados usados ou até pela corretude ou equidade dos algoritmos de aprendizado de máquina aplicados nas suas análises.
Vamos discutir cada um

a)Propriedade dos dados:

Aqui começa a polêmica. Quem são os proprietários dos dados?
-Os dados de sua pesquisa na caixa de search do Google pertence a você ou ao Google? Você foi, no mínimo, o produtor daqueles dados de entrada. Nasceram por sua necessidade/inspiração/curiosidade. As respostas recebidas até que foram produzidas pelos algoritmos do Google. Mas a questões “drivers” da busca foram suas. A localização é sua, o endereço IP é seu. A quem pertence ?
-As imagens de segurança de um supermercado que flagra você e seus filhos caminhando pelos corredores em busca de uma lata de leite condensado. Hoje, com o desenvolvimento de identificação facial, aquelas imagens podem chegar a você. Pertence a você, que está flagrado ou ao supermercado que gravou?
Algumas considerações sobre propriedades de dados já existem, em outros domínios. Por exemplo, quando uma biografia é escrita, a quem pertence os direitos? Ao biografado ou ao escritor? Caso não haja no conteúdo algo que desabone o biografado, não poderá haver nenhuma objeção legal, mesmo que seja uma biografia -não autorizada-. A fronteira entre a liberdade de expressão(do autor) e os dados do biografado é algo que pode ser complexo. Há vários casos na indústria literária brasileira sobre problemas entre autores e biografados(ou seus descendentes). Em 2005, Fernando Morais com a obra que versava sobre a agência W/Brasil, contestada na Justiça por Ronaldo Caiado, virou polêmica. Em 2006, Roberto Carlos com Paulo Cesar Araújo, quando o cantor sentiu violada a sua privacidade por fatos relativos ao seu acidente, quando menino. E finalmente, também em 2006, quando Ruy Castro teve um embate com as filhas do jogador Garrincha, quando escrevia sobre sua biografia. Em 2015, o STF, liberou esse direito, por decisão unânime, apontando que as reparações somente poderiam vir no caso de abusos ou ultrajes eventualmente acontecidos. Não esqueçamos que um livro biográfico é uma coleção de dados de alguém. Por outro lado, aumentando o espectro de complexidade do assunto, um livro de sua autoria é comprado e colocado numa Biblioteca física. Você, como autor, recebeu por um único volume pago, mas dezenas ou centenas de pessoas poderão lê-lo, sem lhe dever direitos pela propriedade do que você produziu. A Wikipédia, por sua vez, é uma espécie de enciclopédia digital escrita por milhares de autores, que não tem nenhum direito de propriedade sobre ela. Há alguns sites que são produzidos com os seus dados, escritos especialmente para eles, via críticas e opiniões (Reclame aqui, TripAdvisor, Rotten Tomatoes,etc). Eles faturam com os dados dos outros e não pagam por isso. 
A propriedade dos dados, bem definida, é algo que representa também valor direto e “monetizavel” sobre esses tipos de ativo. A Microsoft comprou o Linkedin por causa dos 200 milhões de registros dos nossos perfis (escritos por cada um de nós). A IBM comprou a Weather Company, por US$2 bilhões devido aos bilhões de registros de meteorologia e também aos milhares de registros de grandes clientes que os utilizam. Mas as coisas nem sempre são tão lineares assim. Por exemplo, a quem pertence os registros de dados de uma companhia que faliu e não existe mais? A Radio Shack, outrora grande loja americano de eletrônicos, quebrou e quando foi vendida rendeu esse imbróglio. A quem pertenceria os milhões de registros de clientes que ela armazenava? Somente depois de um arranjo jurídico complexo, que envolveu opt-in/optout dos clientes, é que a questão foi resolvida, com a transferência dos bancos de dados para a empresa compradora.
Pior ainda: há sites na Internet que vendem dados embaraçosos sobre pessoas. Por exemplo, os controversos MugShots. Veja a figura 01.


                                              Figura 01- Mugshots

Nela aparecem os chamados mugshots, que são aquelas fotografias tiradas pela polícia, para registrar o autor de um suposto ilícito. Repare que essas fotos(de frente e de lado), são elementos obrigatórios para compor o ato da apreensão policial e temporária, mas que não representam, necessariamente, culpa ou condenação. Mas são extremamente embaraçosos e o pior: são dados públicos(nos EUA), e portanto passíveis de acesso por qualquer um. No exemplo acima, aparecem os mugshots de Jane Fonda, do famoso apresentador da CNN, Larry King, hoje aposentado, de Bill Gates, de Frank Sinatra e de Justin Bieber. Essas fotos circulam livremente pela internet, juntamente com a de outros famosos. Embora controversos, a reprodução desses dados, a partir de uma fonte lícita (Departamento de Polícia)  em sites chamados de MugShots(MugShots.com, BustedMugshots, JustMugshots), não representa crime. Hoje há mais de 80 sites desses na Internet. Embora polêmicos e possíveis de produzir altos danos, a publicação desses dados é defendida por jornalistas e movimentos de livre expressão, além de ser considerada legal pela Suprema Corte Americana. A sua proibição, conflitaria com a Primeira Emenda da Constituição, que fala sobre a livre expressão, quando considera que a publicação de dados públicos é pura manifestação de liberdade. Soma-se a isso, o argumento positivo, de que esses sites estariam prestando um serviço à comunidade, pois mostram publicamente pessoas que estão envolvidas em algum ilícito e que poderiam ser a baby-sitter de sua filha, o professor particular de seu filho ou a fisioterapeuta dos seus pais. O grande problema desses sites, com certa propriedade de seus dados, é que eles cobram taxas para a remoção da sua foto. Variando de US50 a US$500, essas taxas, em tese, serviriam para a deleção das fotos do seu acervo. O grande problema centra no fato que essas fotos poderão estar espalhadas em dezenas deles e aí as coisas complicam. O livro Delete-The virtue of forgetting in the Digital Age (Schonberger), fala exatamente sobre isso: A Internet nunca esquece... Embora os sites de Mugshots argumentem que todas as solicitações de remoção serão devidamente analisadas e feitas gratuitamente para aquelas que comprovarem casos encerrados, absolvições, etc, o problema é sério. Tão sério que hoje já existe um conjunto de sites que se dizem especializados em limpar os seus mugshots(Veja erasemyshots.com). Alguns estados americanos se movimentam para, via legislação, apertar o cerco sobre isso, mas os resultados são lentos. Até 2013, somente os estados do Oregon, Georgia e Utah tinham projetos de lei em sua esfera política para tentar regular esses que são considerados elementos da indústria da humilhação. De lá, até hoje, houve pouca evolução nesse segmento.

Isso exemplifica, de forma simples, a complexidade existente no miolo do conceito de propriedade dos dados. Caberá à Gestão/Governança de dados, quando cabível, um olhar atento sobre o DLCM-Data Life Cycle Management, por exemplo e os aspectos de privacidade e ética sobre eles. A ideia de DLCM , presente nas melhores práticas de dados, tem exatamente esse objetivo de analisar, regular e documentar as  diversas fases da vida dos dados, inclusive a sua eliminação/descarte. (Coleta/produção, tratamento, uso e descarte). Agora, entram também nesse olhar, os aspectos de violação, prejuízos e danos, que os dados poderão causar, em tese, àqueles que seriam seus próprios donos.  

Nenhum comentário:

Postar um comentário