A Governança de Dados é um termo recentemente produzido na
esteira dos jargões que brotaram a partir do termo genérico “governança”. Extraída do contexto maior da governança
corporativa, e meio implícita na Governança de TI, a de dados foca em
princípios de organização e controle sobre esses insumos essenciais para a
produção de informação e conhecimento das empresas. Por tudo discutido no post
anterior, a Governança de Dados será um tema recorrente nos próximos anos e as
empresas deverão se preparar para adotá-la, ou no mínimo, entendê-la com a
profundidade com que será discutida. A
definição de Governança de Dados(GD) é ampla e plural. É um conceito em
evolução, que envolve o cruzamento de diversas disciplinas, com foco em
qualidade de dados, passando por avaliação, gerência, melhoria, monitoração de seu uso, além de aspectos de segurança e
privacidade associados a eles. Para tal, as empresas deverão definir objetivos
organizacionais e processos institucionalizados, que serão implementados dentro
do equilíbrio fundamental entre TI e áreas de negócios . Através da GD as
empresas hoje também definem mecanismos para analisar os processos que se
abastecem de ou produzem os dados, criando um sentido maior de qualidade
conjunta entre esses dois elementos
seminais (dados e processos) e
contribuindo para a valorização desses ativos, através do pleno conhecimento da
cadeia produtiva de informação e conhecimentos. Como processo organizacional, a
GD estabelece políticas e diretrizes corporativas legislando sobre os dados e atribuindo
papéis de criadores/produtores (collectors), mantenedores (custodians)
e consumidores de dados (consumers),
gerando a trinca CCC (collectors, custodians and consumers), siglas que
começam a aparecer nas telas da GD. Acoplados com os preceitos de GD surgem com
muita força os aspectos de qualidade de dados e de informação, até como vínculo
de causalidade. Assim a GD pode ser vista como um guarda-chuva conceitual sob o
qual se abrigarão diversas ações que, no fundo, visam à melhoria desses
insumos, agora fundamentais à luz dos novos tempos: os dados.
Para facilitar a discussão sobre GD, encaminharemos a nossa
reflexão adotando a abordagem comum,
centrada na abordagem do 5W2H, conforme a figura 2.1 lá no final desse “post”:
1) O quê? (What): definir claramente a Governança de Dados
como um componente dentro da visão de Governança Corporativa e de TI, voltada
para os recursos de dados, as informações e os conhecimentos da empresa, o seu
uso controlado, a sua qualidade e as diretrizes para o seu consumo e produção. Há
quem defina a GD como o viés legislativo
e judiciário dos dados, quando comparado com um sistema de poderes da
República;
2) O porquê (Why): como os domínios de dados de uma empresa
são amplos e sensíveis, há que se definir claramente os objetivos que se deseja
alcançar com a adoção de um programa de
Governança de Dados. Por exemplo, pode-se se basear na missão da empresa e em
alguns de seus valores, analisados sob certos prismas:
·
Dimensão empresa, mercado e clientes: a
constante preocupação com a dinâmica do mercado, que pode envolver aspectos de
regulação, aderência às normas e aos relacionamentos com clientes, além de
fatores surgidos por fusões e parcerias, etc.;
·
Dimensão da qualidade: pode ser baseada na qualidade
corrente de dados do sistema, no número de erros e reclamações decorrentes
dessa qualidade, e dos riscos pelas
perdas de valores reais ou de reputação devido aos problemas originados na manifestação
da baixa qualidade desses ativos;
·
Segurança dos dados: pelo crescimento do volume
de dados, o aumento da conectividade da empresa e o consequente volume de
acessos aos dados, criando fronteiras mais expostas e aumentando as chances de
invasões, adulterações e uso indevido de dados e informações. Os aspectos de
privacidade de dados são fatores também considerados nesse ponto;
·
Liquidez e disponibilidade da Informação: pela
crescente necessidade de obter mais rapidamente as informações competitivas e confiáveis
demandadas por áreas estratégicas da empresa, nem sempre integradas pelos
dados. Além disso, pela demanda por novos aplicativos em novos domínios (mineração
de comportamento de clientes, de colaboradores, gerência de projetos, dados não
estruturados, etc.), a geração e retenção cada vez maior de conhecimento do negócio
da empresa, sempre considerando o dado como elemento central na produção de
informação e derivação de conhecimento.
Uma forte motivação organizacional é fator preponderante na
adoção corporativa e no engajamento e
comprometimento com um programa cuja implementação não é trivial. Ela
envolve esforços e investimentos, além de fortes alterações culturais visando
quebrar paradigmas enraizados, como o “proprietarismo” , as “paróquias” de
dados e
a indulgência sobre o descontrole
a que esses importantes ativos
foram relegados;
3) Onde (Where): como qualquer programa de natureza
organizacional deverá seguir os preceitos de pensar global e agir local. Definir
claramente que áreas deverão ser focos prioritários dos trabalhos de GD é um
dos primeiros passos. Por exemplo, áreas críticas em que residem os MD (Master
Data - Dados mestres), como clientes, fornecedores, produtos, locais, etc. Os
dados considerados mestres já são focos de uma perna da GD, denominada MDM (Master
Data Management), que exploraremos adiante. As áreas escolhidas deverão ser
aquelas que apresentam maior sensibilidade aos negócios, permitindo uma
abordagem que objetive a produção mais consistente de dados e informações para
a geração de conhecimentos estratégicos e melhoria nos processos de tomadas de
decisão da empresa;
3) Quando (When): planejar a implementação dos programas de
GD em ciclos, com iterações que possam produzir melhorias metrificadas em
termos de qualidade, controle, risco e segurança de dados. Um projeto dessa
natureza certamente requererá iterações com
entregas periódicas de resultados, que permitam a sua reavaliação constante e o
seu amadurecimento ao longo do caminho. Uma abordagem com ciclo de vida
“cascata” num processo dessa natureza certamente implicará altos riscos. De
novo, vale a filosofia de pensar globalmente e agir localmente;
4) Quem (Who): identificar e trabalhar com os principais
envolvidos nas áreas críticas definidas, contemplando os CCC:
Creators/Collectors, Consumers e Custodians, que, traduzidos, seriam os
criadores, consumidores e mantenedores dos dados.
Definir um grupo capaz de conduzir as ações propostas, numa espécie de
Escritório de Dados que, através de reuniões, acompanhe o desenvolvimento e a
implementação da estratégia, envolvendo todos os interessados e definindo
caminhos e alterando rotas, quando necessário. Seria o equivalente ao PMO, para
os projetos e o SEPG (Software Engineering Process Group) para
os processos. Seria algo como o DGPG, ou Data Governance Process/Program Group, ou DMO (Data Management Office). Um conselho de Governança de dados, composto por elementos de várias áreas de negócios e TI, atuando como um comitê de supervisão é fator fundamental na solidificação do programa, na consolidação da parceria “TI+Negócios” e na resolução de conflitos. E finalmente, a criação de figuras de gestores de dados(data steward), representantes locais de áreas de negócios responsáveis pelos dados mais sensíveis daquela unidade organizacional ou sistema. Todos esses papéis já estão sendo gradativamente amadurecidos em várias implementações de projetos de GD, podendo, em alguns casos, oferecer variações de títulos. Por exemplo, o conceito de “data custodian” pode variar entre implementações, sendo que em algumas aparece mais associado à equipe de TI e em outras também é sinônimo de data steward(gestores de dados presentes nas áreas de negócios). O importante é entender que basicamente , em todas as implementações, você distinguirá 3 camadas de papéis: a mais alta formada pelos decisores da alta gerência, aos quais competem as definições maiores e as diretrizes do programa, além da resolução de conflito; uma camada média, formada pelo DMO, ou escritório de dados, que gerencia os programas de GD e na ponta, com os data stewards(gestores de dados), lotados nas áreas de negócios, responsáveis pela custódia semântica e lógica dos dados. Os envolvidos de TI também estariam nesse nível, responsáveis pela custódia física dos dados, habitantes de bases de dados, ERP´s e data warehouses. ;
os processos. Seria algo como o DGPG, ou Data Governance Process/Program Group, ou DMO (Data Management Office). Um conselho de Governança de dados, composto por elementos de várias áreas de negócios e TI, atuando como um comitê de supervisão é fator fundamental na solidificação do programa, na consolidação da parceria “TI+Negócios” e na resolução de conflitos. E finalmente, a criação de figuras de gestores de dados(data steward), representantes locais de áreas de negócios responsáveis pelos dados mais sensíveis daquela unidade organizacional ou sistema. Todos esses papéis já estão sendo gradativamente amadurecidos em várias implementações de projetos de GD, podendo, em alguns casos, oferecer variações de títulos. Por exemplo, o conceito de “data custodian” pode variar entre implementações, sendo que em algumas aparece mais associado à equipe de TI e em outras também é sinônimo de data steward(gestores de dados presentes nas áreas de negócios). O importante é entender que basicamente , em todas as implementações, você distinguirá 3 camadas de papéis: a mais alta formada pelos decisores da alta gerência, aos quais competem as definições maiores e as diretrizes do programa, além da resolução de conflito; uma camada média, formada pelo DMO, ou escritório de dados, que gerencia os programas de GD e na ponta, com os data stewards(gestores de dados), lotados nas áreas de negócios, responsáveis pela custódia semântica e lógica dos dados. Os envolvidos de TI também estariam nesse nível, responsáveis pela custódia física dos dados, habitantes de bases de dados, ERP´s e data warehouses. ;
5) Como (How): pensar em definir as regras e as diretrizes
do processo de GD, através de políticas que deixem claro quais são as
restrições, suas aplicações e os envolvidos. Também a definição dos direitos,
padrões e responsabilidades associadas ao uso, à atualização e à liberação das
informações. Definir como se pretende a implantação dos mecanismos ou subprojetos de melhoria e alcance dos
objetivos traçados na missão. Por exemplo, implantando um Plano de Qualidade de
Dados, baseado na filosofia de TDQM (Total Data Quality Management), do MIT,
para as ações de melhoria de qualidade, ou desenvolvendo projetos na área de
MDM (Master Data Management) para tratamento de cadastros mestres considerados estratégicos. Definir objetivos
e métricas que possam ser usadas para medir o alcance do programa, dentro da
ótica de que somente se gerencia aquilo que se mede. Por exemplo, diminuição de
erros em dados, redução de número de reclamações/erros por liberações de
sistemas e produtos, redução de dados mestres duplicados em áreas recentemente
submetidas a fusão/merging, diminuição da proliferação de bancos de
dados setorizados, etc;
7) Quanto (How Much): o programa de GD deverá contemplar um
conjunto de projetos que, por definição de prioridades, implicará custos de
várias naturezas. Custo de pessoal envolvido, custo de software/hardware,
custo de treinamento, consultoria e mentoring, etc. Tentar obter ROI
pode ser uma tarefa difícil, devido aos ganhos intangíveis que a qualidade, ou
a falta dela, traz à imagem, à marca e à reputação da empresa. Uma boa
estratégia a se adotar é trabalhar com o “custo negativo” : Imaginem o custo de
uma Área pública de Saúde, com dados mal controlados sobre cidadãos atendidos
em suas unidades. Imaginem, por hipótese, que dois cidadãos atendidos têm o
mesmo nome: José Ferreira dos Santos. Imaginem também que um tem problema de
diabetes(hiperglicemia) e o outro tem
crises de hipoglicemia. Imaginem as complicações produzidas se as fichas forem
trocadas por falta de uma identificação mais efetiva de registros, ou seja um
descontrole na qualidade dos dados. Imaginem o quanto os problemas de qualidade
de dados podem significar em termos de reputação ou de valores mais
significativos do que esse!. Larry English, no seu livro Information Quality Applied, da Editora Wiley(2009) , mostra no capítulo 1, uma tabela com dezenas de
exemplos que mostram o alto custo da baixa qualidade. Leia e se espante.
Com esse esquema de 5W e 2H, a empresa deverá criar os seus
primeiros entendimentos e a busca de seus caminhos em direção à Governança de
dados e de informações. Desafio puro.