Como se encontram os conceitos de Governança, Gestão de
Dados e correlatos, no momento nos EUA?
Evento: Conferência de Inverno de Governança de Dados,
ocorrido entre 14-18 de Novembro de 2016, em Delray Beach – Flórida .
Drops finais:
1)Uma das áreas com maior grau de potencial para a
aplicação de GD é a de Health Care. Participei de uma reunião de um SGI-Special
Group Interest, especificamente em Health Care. Na verdade, eu estava lá, muito
mais como observador, prestando atenção nas discussões de um grupo focado em GD
naquele segmento específico. Há estatísticas que apontam que 67% dos registros
médicos tem erros de dados. Com a definição do “Medicare”- programa de seguro
de saúde para maiores de 64 anos, ou outros com problemas renais crônicos, ou “Medicaid”-
programa para menores ou iguais à 64
anos, com limitações para pagamentos deste tipo de seguro, tornou-se
fundamental o controle mais rigoroso dos dados por parte das prestadoras e a
visão mais forte de “compliance” por parte dos agentes reguladores. A área de
saúde considera dados como elemento que pode decidir a sobrevivência de um
paciente, diferentemente dos “draw-backs”, que podem acontecer em outras
verticais. Como vencer a resistência da alta gerência que ainda reluta na
adoção de GD, ou o uso de Big Data para o tratamento e a prevenção/controle de
novas internações, foram os pontos mais discutidos. A IBM, com o seu
Watson(sistema de Inteligência artificial) está se dedicando com muita ênfase ao
estudo e prevenção de câncer, por exemplo. Utiliza os seus complexos algoritmos
de inferência estatística, aliado com os exa(*)-volumes de informações
armazenados e trabalhados por um arsenal poderoso de máquinas e processadores. (exabytes são 1024 petabytes, que são 1024
terabytes....);
2)Diversas palestras de usuários foram apresentadas
elencando os aspectos desafiadores de uma implantação de GD. Claro que a maioria tocou nos aspectos de uma forte
conexão com os objetivos de negócios,
busca do patrocínio para se mudar atitudes e culturas, escolha correta
dos owners, etc. Na palestra da Navient, uma grande organização financeira
especializada em empréstimo escolar, me chamou a atenção o foco dado em um
ponto, por vezes, pouco observado: A comunicação do programa de Governança de
dados. Como parte da mudança cultural sobre os dados, esse ponto se mostra
fundamental. Logotipo especial sobre o programa, comunicação forte focada em
pessoas e resultados obtidos podem fazer a diferença. A organização(Navient)
tem um Conselho de Data Stewards (Gestores de dados) de 18 membros, o que
reforça a necessidade de uma boa comunicação entre eles;
3) Um outro assunto muito comentado nas palestras,
principalmente quando são mostradas as ferramentas que apoiam
GD(AGS/Rochade;Collibra/Collibra, Orchestra/EBX5) é Data Lineage, ou linhagem
de dados. Representa a rastreabilidade de um dado saindo da sua origem e
chegando no seu destino, com todas definições em torno dos processamentos a que
será submetido. Imagine, por exemplo, o valor de imposto de renda a ser cobrado
ou restituído, que é o produto final da sua declaração, no processo de IR.
Olhando o fluxo de dados, você perceberá que os dados entrados na sua
declaração (rendimentos oficiais, despesas, etc) serão submetidos a vários
processos, alguns no seu PC quando você está entrando com eles e outros em
processamentos forward(feitos na RF), que acabará na produção do valor final
(R$ a ser pago ou a ser restituído). Imagine uma forma gráfica e
documentacional de registrar isso. Isso é a linhagem de dados. É claro que para
se ter uma visão precisa dos dados de uma empresa(dos principais e mais
críticos, claro), a linhagem de dados é fundamental. Ela está associada com o
conceito de ciclo de vida dos dados, um elemento fundamental e com o conceito de
“data provenance”, algo como proveniência dos dados. Com a linhagem dos
principais dados, por exemplo de “compliance”, a GD ajuda em possíveis socorros
quando houver qualquer valor glosado por agências reguladoras, pois a análise
da linhagem permite a identificação dos pontos possíveis de origem do problema.
É o assunto do momento, dentro da categoria Metadados. Alguns pontos anotados
sobre Linhagem de dados:
·
Estabelecer linhagem de dados não é uma
abordagem fácil de se implementar
·
Quase 50% das empresas não tem Data Lineage
implementada
·
Quando implementada e suportada por uma
ferramenta, deve-se tratar os dados principais e críticos que estão sob o olhar
da Governança de dados
·
A Linhagem de dados pode variar , dependendo
da perspectiva de cada LOB(Linha de negócios).
4)Um termo interessante que apareceu na palestra da
Collibra foi “amazonification of data”. O termo, no fundo, significa a
facilidade que se tem para localizar um livro na Amazon e comprá-lo
instantaneamente, sem grande trabalho, com poucos cliques. A metáfora foi
construída para abordar a dificuldade de se obter os dados neste crescente
ambiente de hoje nas empresas. Múltiplas fontes, ambiguidade semântica, silos
construídos sem nenhuma preocupação, etc tem dado muita dor de cabeça aos
Cientistas de dados, que gastam a maior parte do seu tempo tentando localizar
os dados necessários. Gastam mais tempo identificando os dados necessários do
que dedicam à sua análise inferencial e científica.
5)Um debate que produziu interesses foi sobre “Qual seria
o futuro da GD?”. Foi conduzido por Danette McGilvray, com quem tenho
encontrado sistematicamente nos vários eventos de dados, de que tenho
participado. Às respostas , já comentadas em posts anteriores, se acrescente a
formação do primeiro PHD- DSc em Qualidade de dados dos EUA, formado pela
Universidade de Little Rock, no estado do Arkansas. Essa universidade tem uma
tradição muito forte na área de Qualidade de Dados(conceito no qual eles englobam
o de Governança de dados), capitaneada pelo Professor John Talburt, com quem
encontrei em Baltimore, no último IAIDQ. Uma discussão correlata foi a
progressão da carreira dos profissionais de dados, principalmente dos Gestores
de dados, o que seria uma forma inteligente de incentivar essa carreira, que se desenha fundamental dentro
da Governança de dados. Hoje se percebe somente carreiras colaterais, sendo
desenvolvidas, como Cientistas de dados. Outro ponto será o crescimento de
tipos de dados, hoje ainda incipientes, como voz. A análise de voz, via ligações
de call centers, podem evidenciar alguns traços de clientes e a inferência de
informações sobre eles. O uso de imagens, hoje já aplicado em propagandas de
quiosques na Coreia, poderá permitir a personalização de
comerciais/advertisements, baseada em aparências e expressões. Um outro ponto
que deverá evoluir no campo de GD será a comercialização de dados, hoje bem
mais rigorosa na Europa e mais flexível nos EUA. A expectativa é que essa
leniência encontrada hoje nos EUA seja , no futuro, modificada por uma
legislação mais rigorosa, preveem os especialistas;
6-A GD também se mostra em grande crescimento na China,
conforme testemunhou Danette McGilvray, que recentemente lançou o seu famoso
livro de Qualidade de Dados lá e havia retornado daquele pais diretamente para
o evento de DelRay, conforme me falou. Também na Austrália, conforme depoimento
do executivo da BackOffice, o conceito de GD cresce significativamente. No
Brasil, afetado pela crise , o movimento de implantação de GD ainda está em
relativa temperatura morna. Entretanto, mais cedo ou mais tarde, as empresas
acordarão para essa importante perspectiva de terem os dados gerenciados como
uma ativo organizacional. Questão de tempo...
7-Terminada a Conferência, fiz um curso de 2 dias sobre Data
Stewardship(Gestão de Dados), com David Plotkin. Plotkin é autor de um dos
melhores livros no assunto e talvez seja a figura mais experiente em Gestão de
dados nos EUA. Atuou em duas grandes empresas na área de seguros AAA e AIG a
atualmente comanda a área de Governança de dados do gigantesco Banco Wells
Fargo. Por dois dias, foi possível trocar experiências e observar a implantação
de GD na prática. Valeu pela Conferência..