Continuação do post anterior.
e)Tendências emergentes e o futuro
da GD-Governança de dados
No último painel do DGIQ-2018,
participaram Sunil Soares, renomado consultor e o autor com mais livros sobre
GD atualmente no mercado, parelho com David Loshin, Ann Buff , participante
ativa do DGPO(Data Governance Professional Organization), HoChun Ho, chefe de
GD da JLL, gigante mundial do ramo de imóveis(real estate) e Rex Ahlstrom,
diretor da Backoffice Associates, ferramenta de dados muito respeitada nos EUA,
Europa, Asia e Oceania, mas desconhecida no Brasil. Quem mediou a discussão foi
Anthony Algmin, consultor independente de dados. As perguntas/temas colocados
para discussão:
E1)A possível evolução do papel de
CDO: Esse ponto ainda mostra uma indefinição de como vai ser o movimento do
papel do CDO em direção ao futuro. Há muitos CDO´s nos EUA e na Europa. No
Brasil, menos de uma dúzia, eu acho. Grande parte das grandes empresas mundiais
tem esse papel, normalmente definido como a figura contratada para transformar
os dados em elemento “monetizável”, não pela sua venda direta(conceito supostamente imaginado),
mas como elemento de transformação e criação de novos produtos e modelos de
negócios. Curiosamente nesta sessão, havia somente 1 CDO presente. A percepção transmitida
é que , independentemente do nome do papel, o conceito de preparação, uso dos
dados e sua gestão como ativo da empresa veio para ficar, conforme disse o
chefe de GD da JLL. Tenha a empresa um CIO ou CDO, ou ambos. Esteja a GD sob o
CDO, CFO, CMO, etc, os dados serão vistos com outros olhos. Ponto
E2)O casamento entre GD e IA(Inteligência
Artificial): Essa relação mais estreita entre GD e IA apareceu com destaque nas
palestras de ferramentas de dados, conforme falei acima. Ann Buff, Sunil Soares
e HoChun Ho, entretanto lembraram de algo sobre o qual já escrevi neste Blog
(vide artigos anteriores). “Os aspectos éticos dos dados”. Esse ponto, ainda será amadurecido, mas a
preocupação já existe. Na minha visão, a GD(Governança de dados) e QD(Qualidade
de dados) tangenciarão o conceito (que ainda não existe formalmente definido)
de Governança/Gestão de resultados de dados, visando o controle sobre os
algoritmos de machine learning chamados impenetráveis(inscrutable). São
algoritmos que, pelos números de interações e modificações de variáveis não
oferecem a rastreabilidade de como se chegou naquele resultado final. E , não
se pode esquecer que certas regulações exigem
que resultados sobre análise de dados de pessoas(clientes, empregados,
parceiros, etc) sejam devidamente explicados. Por exemplo, se um algoritmo
dessa natureza for aplicado num processo de seleção, ou na inferência sobre
certas características de uma pessoa, lembre-se que, pelo GDPR (em vigor desde
25 de Maio/2018), há a o direito à explicação. Assim, a empresa, via GD sendo
responsável pelos aspectos de segurança e privacidade dos dados de alguém, e um
algoritmo de Data Science inferindo algo que não pode ser explicado, sugere um
potencial “problema” desenhado para um futuro próximo. Pensar nessa nova área
de dados não deverá ser algo para se negligenciar.
E3)BlockChain: Esse assunto foi
considerado verde pelos debatedores, que o posicionaram como (ainda) um
possível fenômeno “hype”. Na minha modesta visão, esse conceito será mais
explorado nos modelos de BD Distribuídos, o que poderá levar à viabilização do
padrão de transacionalidade “ACID-like” em bancos totalmente distribuídos. Mas
esse assunto “Blockchain”, não foi sequer considerado “relevante” pela mesa dos
debatedores.
E4)GDPR: A Regulação Europeia
chegou, no dia 25 de Maio passado e com isso as empresas sob esse foco se
obrigaram a estabelecer uma GD meio que às pressas, mas que será para sempre. Assisti
a uma apresentação de uma ferramenta de glossário de dados (Datum), oferecendo
as vantagens de se poder ter os dados PII devidamente catalogados(quais dados a
empresa tem na classificação PII), com possibilidade de conhecimento de sua
linhagem(como os dados estão sendo processados, de onde vieram, para onde foram),
os responsáveis por eles,etc,etc. No DGIQ de 2016, pela primeira vez tive
contato com o conceito, que estava começando nos EUA e trouxe para o Brasil,
quando escrevi sobre GDPR(veja artigos anteriores). Fui um dos primeiros, se
não o primeiro. Hoje vejo, que o Brasil acordou (meio tarde, claro), quando
recebo notícias de que a GDPR brazuca está sendo reativada. Projeto de Lei do
Senador Antônio Carlos Valadares (de 2012), o “GDPR-BR” volta à tona, com
reuniões já marcadas para Agosto, quando um grande Seminário reabrirá a
discussão pública do tema. Antes tarde ......
E5)Single source of truth: Esse
conceito foi trazido quando as proposições de BD dos anos 70 se mostraram
incapaz de domar as replicações de dados. Surgiu como driver das tecnologias de
MDM-Master Data management, que tomaram posição forte, propondo a versão única
dos dados. Para minha surpresa, ouvi de algumas empresas, de grande porte e
atuação global, que o conceito SST(Single Source of Truth) dos dados também
estaria com os dias contados, sendo substituído por uma onda que se chamaria “Dados
em Contextos”. No fundo, seria o retorno aos modelos de dados, com permissão de
replicação, porém controlada pela GD. Essas manifestações senoidais das
tecnologias em geral e as de dados em particular sempre existirão e o que se
deve fazer é aguardar e viver cada momento dos bits e bytes, sem o entusiasmo
dos vendedores de soluções.
3)Encontrei com alguns “amigos de
dados,” como Danette McGilvray, que é uma das mais famosas especialistas em
qualidade de dados. Circula pelo mundo dando aulas e palestras sobre QD(já
esteve no Brasil) e sempre, que possível, sentamos para conversar. Foi a criadora do
Manifesto de Dados(juntamente com John Ladley e outros), que foi traduzido para o português por mim e
por Bergson L. Rego. A versão em português foi a primeira, depois da versão
original e agora já existe a francesa e a espanhola está sendo feita. Danette tem
um livro sobre QD, dos mais citados e ela pediu para conversamos sobre a nova
edição que pretende fazer. Logo depois, recebi um email, que foi enviado para
muitos da área, solicitando possíveis evoluções nos conceitos de QD, que ela
aplica no seu livros-10 Passos da QD). Também encontrei com David Plotkin, de
quem fui aluno no curso (Data Stewardship) no DGIQ de 2016. Plotkin é
apaixonado pelo Brasil, já esteve no Amazonas e sempre falamos. Tem um livro
publicado onde aprofunda no trabalho dos Gestores de dados(data stewards), que
recomendo (Data Stewardship-An Actionable Guide to Effective Data Management
and Data Governance). Plotkin era o chefe de GD do Banco Wells Fargo e agora
foi para o banco MUFG-Bank of Tokio-Mitsubish, o maior banco do Japão. Danette
e Plotkin ministram os cursos opcionais(Qualidade de dados e Data Stewardship)
que fecham o evento na 5afa e 6afa.
4)Resumo: O DGIQ continua sendo o
grande evento sobre Governança e Qualidade de dados atualmente no mundo.
Promovido duas vezes por ano, um na Costa Leste e outro na Costa Oeste reúne um
conjunto de experiências e posições extremamente rica. É claro que se deve
analisar e escolher cuidadosamente as palestras, tutoriais e cursos oferecidos,
pois pelo gigantismo do evento, replica-se informações transmitidas, em certo
grau. Mas vale a pena, para confirmar os seus passos como consultor, ajustar
caminhos, descartar hypes e modismos e esperar novos termos e conceitos que
logo chegarão (Curadoria de dados é um deles...).
Conforme prometido, essa foi a
sinopse dos principais temas discutidos.
Voltarei ao assunto no Linkedin, e/ou
nos cursos de Pós ou de GD. Abraços .