Total de visualizações de página

sábado, 23 de junho de 2012

Governança de Dados-Parte VIII-b-Visão europeia sobre Governança de dados-continuação do post anterior(Visão Steve Sarsfield):


Governança de Dados-Parte VIII-b-Visão europeia sobre Governança de dados-continuação do post anterior(Visão Steve Sarsfield):  

O Data Champion e os aspectos de convencimento sobre a importância de GD, através de busca de apoio financeiro para seus projetos.

Steve Sarsfield usa um termo “data champion” para designar a pessoa ou um grupo de pessoas, apaixonadas por dados, com capacidade para trabalhar as ideias de GD ou de gestão estratégica de dados  para serem compradas pela alta camada de decisão da empresa e  implementada com sucesso. É um grupo ou papel que  deve transitar bem pelos negócios, pela TI e por outras partes envolvidas. Deve ter conhecimento de tecnologia e sensibilidade sobre a importância dos dados, ótima capacidade de comunicação e de relacionamentos interfuncionais e interdepartamentais. Um bom começo é definir uma ou mais áreas de negócios como a área focal, listar seus principais “envolvidos” e mapear os seus dados e as  áreas responsáveis por eles. Os envolvidos devem saber o conceito de metadados e de schema, porém sempre explicado para os “negocistas” de forma clara e didática. O “Data champion”, que caracteriza esse papel, deverá ter além disso, uma forte capacidade de venda e convencimento da visão sobre os dados, e claro, ser um positivo e sorridente evangelista das ideias de GD. Deverá ser pragmático e capaz de enfrentar desafios e bloqueios, pois nessa área cinzenta de dados, ou os dados são de todos ou são de ninguém, num corolário torto produzido pela era em que os dados foram relegados ao plano de combustível de processos. Em ambos os casos, isso é problema dos mais sérios. Ter capacidade de liderança é imprescindível e Sarsfield até sugere no seu livro que o pretenso “Data Champion”, seja pessoa ou papel, procure ler obras de Dale Carnegie e John Maxwell, visando a melhoria desses aspectos de liderança e de capacidade de enfrentamento de obstáculos. Um fator fundamental nesse momento é ter um discurso sobre o retorno que a empresa terá pela implementação de GD. Isso não é fácil. Aspectos simples, como aumento de faturamento, diminuição de custos e redução de riscos são fatores verdadeiros, mas devem ser consubstanciados com visões mais objetivas. Outro fator que ajuda é a argumentação pelo “oposto”. Quais as possíveis consequências de não se ter uma estrutura de GD? Por isso é que um projeto inicial de “data profiling” é sempre um bom começo para se radiografar o estado dos dados e seus potenciais riscos por problemas de qualidade. Escolha, assim, as  áreas sensíveis de dados para serem analisadas, buscando aquelas onde se concentram as  maiores reclamações de qualidade . Um dos desafios do “Data Champion” é criar credibilidade sobre suas proposições. Uma das abordagens  sugeridas é tecer os relacionamentos nas áreas, entendendo os seus problemas e aflições sobre dados e sentindo na pele os resultados negativos de campos mal preenchidos e suas consequências. O “Data Champion” deverá estar sempre atento aos problemas emergentes de dados nascidos de falta de qualidade e deitar falação sobre esses pontos, usando-os como alavanca para as suas proposições. O olho em projetos emergentes com características “Data Intensive” é uma boa abordagem, pois ali podem estar os argumentos que faltaram para o convencimento pleno que não se conseguiu por caminhos mais lineares. Aplicações de CRM, projetos de DW, aplicações de integração de sistemas, etc são ótimos alvos dessa lupa analítica do “Data Champion”.  Uma boa estratégia é observar áreas sensíveis e estabelecer diálogos sobre alguns pontos como:
·         Marketing
o   Vocês estão trabalhando em campanhas novas?
o   Como estão as listas de clientes?
o   Qual a taxa de retorno vocês tem obtido desses envios?
o   Como o sistema de CRM tem ajudado?
o   Você acha que temos dados para alavancar relacionamentos fortes com nossos clientes?
·         Compra/Material
o   O dado reflete a correta posição do estoque?
o   Você, já alguma vez, pagou duas vezes o mesmo fornecedor pela mesma compra?
o   Os preços dos nossos itens refletem  o nosso poder global de compras?
·         Cadeia de suprimentos
o   As nossas entregas retornam por problemas de endereçamento? Qual a frequência e qual o custo?
o   Se tivermos um “recall” de produto, quão efetivo estão os nossos dados para alcançarmos os nossos clientes alvos do recall?
o   Como vocês gerenciam o fato de manter baixo custo de estoque contra a presença duplicada de itens no estoque?
o   Nós compartilhamos a disponibilidade de nossos produtos com parceiros? 
·         Executivos
o   Vocês tem os dados(métricas) necessárias para a tomada de decisão? Com que grau de satisfação isso acontece?
o   Você confia nos dados retornados?
o   Você já se defrontou com erros provenientes desses dados?
o   Você acha que precisaria de dados(métricas) mais confiáveis?
o   Qual o seu grau de confiança com relação à aderência dos dados em relação às leis do nosso país?
·         Cobrança
o   Você já cobrou a mais ou a menos alguns de nossos clientes?
o   As cobranças chegam aos nossos clientes corretamente ou há um grau de envios perdidos ou retornados?
Todas essas perguntas poderão ser feitas na base da técnica dos 4 “ porquês” , que permite um aprofundamento cíclico das questões, caso a paciência do interlocutor não chegue ao limite na altura do segundo “ why”...

Como é uma equipe de GD?
A visão de Steve Sarsfield sobre a composição das estruturas de GD está na figura abaixo. Na realidade, embora a figura mostre certas variações com relação ao que já encontramos em outras proposições, na essência as coisas se mantém. Sarsfield cria a figura do “Data Champion” como elemento central. Essa caixa pode ser uma pessoa ou um grupo, desempenhando papel e tem o driver da gerência dos projetos de GD. Ou seja, ele é quem coordena  e controla o desenvolvimento das ações de GD. Para tal, se mune de um processo, que pode ter sido originado , por exemplo, no framework do DGI , de Gwen Thomas, ou nas proposições do DGS-Data Governance Society, ambos detalhados anteriormente. Esse personagem, que desempenharia a figura de GP da GD, conduziria os projetos do programa. Acima dele, aparece  a figura de um executivo  do tipo C*O, como define Sarsfield. Pode ser o CFO(Chief Financial Officer) ou um CMO(Marketing), dependendo da área que apresentar os maiores sinais de problemas de dados. O CEO até pode ser um elemento dessa natureza, porém considera-se inadequado o CIO como elemento  associado a esse papel. Na estrutura acima do Patrocinador executivo(C*O)”, aparece um Conselho de GD, presente em todas as proposições analisadas, que seria o órgão regulador, aprovando aspectos de Padrões , Processos e Regras de GD, eventualmente sugeridas na área do patrocinador executivo ou do Data Champion. Num nível ainda alto, há um Steering Committee, que faz o papel de um Comitê formado por executivos de várias áreas. Essa caixa sugere uma certa redundância com o Conselho de GD. Trabalhando diretamente com o GP do GD aparecem as figuras dos gestores de dados, aqui com denominações ligeiramente diferente. Sarsfield chama de gestores de dados, aqueles envolvidos com dados na esfera de TI(que em outras proposições aparece como os data custodians). Os gestores de dados(do nível da tecnologia), fariam a ponte entre os gestores de dados do nível de negócios(aqui chamados de representante de negócios) e as ferramentas . Os gestores de dados da TI fariam a gestão dos modelos de dados, enquanto os do domínio de negócios fornecem com maior clareza e entendimento os processos de negócios e os seus dados envolvidos. Finalizando, como não poderia de ser, Steve Sarsfield sugere a presença de uma caixa de consultoria, honrando o papel que desempenha na Talend, uma empresa específica desse nicho de GD e dados e que apresenta crescimentos  com cifras sensacionais, como 108% de 2010 para 2011 e a carteira de clientes pulando de 2000 para 3500, segundo a Wikipedia consultada. 
Nos capítulos subsequentes Steve Sarsfield foca nos aspectos de aplicação de data profiling em áreas como CRM, Supply chain, etc enfatizando a importância de se traduzir os achados de impurezas em métricas eloquentes. Assim, os percentuais de dados impuros em cadastros de CRM, passando pelas lacunas em nível mais físico como apontado por Codd(integridade de entidades, de relacionamentos e de domínios de atributos) até problemas de natureza negocial, como o percentual de campos nomes e endereços com erros, ou duplicados serão, por exemplo, levantados. De posse dessas métricas, cuidadosamente coletadas num projeto de medições e dispostas em gráficos de alta visibilidade, parte-se para a árdua missão de demonstrar as rachaduras encontradas nos grandes depósitos de informação da empresa e justificar onde a GD poderia interceder para resolvê-las. O autor versa também sobre algumas ferramentas de mercado que poderão auxiliar na missão de GD até desaguar em exemplos reais, como o ilustrado a seguir.

Casos de estudo sobre a aplicação de GD na British Telecom

BT-British Telecommunications
Considerada uma das maiores empresas de telecomunicações do mundo, a BT evoluiu através de diversos processos de merges e aquisições. Com cerca de 20 milhões de clientes, a gigante inglesa tinha em 1997 aproximadamente 700 sistemas que gravitavam por sobre as suas linhas de produtos. Esses sistemas consumiam diversos “silos” de dados, denominação dada aos arquivos, bancos de dados ou estruturas informacionais como Data Marts, que não apresentam níveis de integração capazes de garantir a integridade das informações que nele residem. Premida pela alta dispersão de seu acervo e pela vigilância da EU-Data Protection Act, rigorosa legislação européia que dispõe sobre segurança e privacidade de dados pessoais de clientes, a empresa empreendeu um plano de GD (Governança de Dados). Com a estratégia de “pense global, aja local”, a empresa iniciou com uma equipe pequena se atrevendo a entender e pesquisar a qualidade dos dados que circulavam por seus sistemas de negócios. Depois de entrevistar trinta dos  principais stakeholders-chave dos negócios da empresa, obtiveram uma visão sobre a qualidade dos dados da empresa. Subsequentemente empreenderam ações na área de marketing através de projetos de qualidade e profiling de dados, usando as ferramentas da Trilium, empresa do grupo Harte-Hanks, especializada em limpeza, integração e governança de dados. Partiram também para a uma estratégia de visão integrada de clientes, estabelecendo os primeiros pilares da GD. Com a semente de GD lançada, nasceram as primeiras políticas definindo, de forma corporativa, o sentido de qualidade da informação, contemplando atributos já discutidos como precisão, completude, confiabilidade, acessibilidade e disponibilidade. Com um forte plano de comunicação empresarial, definiram ferramentas padronizadas para as unidades organizacionais, para posteriormente unificar, em um só grupo, todos os envolvidos em qualidade de dados das diversas unidades de negócios. Assim, foi criado o que chamamos de DGPG, centro de excelência em governança e qualidade de dados. Os primeiros resultados em economia  direta, fator único que efetivamente sensibiliza os patrocinadores de um programa como esse, vieram a partir de 2002. Estima-se que a empresa tenha tido um retorno na faixa de um bilhão de dólares com o programa de GD implementado.


Visão adaptada do conceito de Steve Sarsfield sobre Governança de Dados



sábado, 2 de junho de 2012

Governança de Dados-Parte VIII-a-Visão europeia sobre Governança de dados:


Governança de Dados-Parte VIII-a-Visão europeia sobre Governança de dados:  

Essa visão foi obtida através da análise da obra de Steve Sarsfield, que publicou o primeiro livro  com um título explícito com Data Governance: The Data Governance Imperative, em 2009, do livro de Enterprise Data Governance, de Pierre Bonnet e de uma pesquisa francesa sobre qualidade de dados(qualitée des données), publicada pela PWC-Price Waterhouse Coopers .Os posts serão divididos em 5 partes(de A a E), para facilitar a publicação

Visão Sarsfield:
Steve Sarsfield é hoje um evangelista de qualidade e de governança de dados que trabalha na Talend, empresa de software open source  que oferece serviços e produtos de  gerência e integração de dados. Originada na França(Suresnes), a empresa hoje se espalha pelo mundo com escritórios nos EUA, Europa e Ásia, inclusive com presença no Brasil.
O livro aborda os seguintes pontos, importantes para o conhecimento e a aproximação com os conceitos de GD, que discutiremos abaixo:

a)A necessidade de se ter Governança de dados
Nesse capítulo são abordados os mesmos fatores já plenamente conhecidos sobre a necessidade de se estabelecer a GD, indo da obrigatoriedade de maior qualidade de dados  para melhoria de tomada de decisões, passando por aspectos de riscos, associados a regulações da indústria (Basel-II, Sox,etc) e chegando a patamares de maturidade de dados de onde as empresas deverão se aproximar. O autor fala sobre alguns pecados de dados cometidos por empresas, principalmente na esfera de crescimentos através de aquisições e fusões, onde dados de empresas  adquiridas são simplesmente agregados aos dados das empresas adquirentes, criando um mosaico complexo de redundância descontrolada sobre informações de possíveis clientes, fornecedores, e outros objetos comuns. Assim nascem os silos de dados, conceito aplicado aos depósitos isolados de dados, usados por unidades organizacionais diferentes. Esses pecados são materializados através de falta de padronização entre essas unidades, visto estarem usando dados de fontes diferentes, baseadas em tecnologias diferentes, com eventuais metadados diferentes e às vezes em línguas diferentes. Com o aparecimento dos problemas, as unidades partem para soluções também particulares, sem uma visão que articule os mesmos conceitos do ponto de vista organizacional, pecando pela falta de orquestração entre as partes. Nesses cenários,  soluções apressadas de BI aparecem como elemento de salvação, transferindo para as camadas de ETC, toda a responsabilidade de processos de qualidade que deveriam ter sido aplicados no nascedouro dos dados já no fluxo de seus processos associados.

b)A definição de Governança de dados
A definição de GD pode variar de pontos de vistas diferentes dentro da empresa. Na realidade, a definição vem mesmo, segundo Sarsfield, da expectativa que as áreas têm do que venha a ser GD. Segundo Sarsfield, a empresa tende a observar a GD como um elefante no quarto escuro(metáfora similar à usada pelos autores do livro originado da DGS-Data Governance Society, cujo título é: The Elephant in the room:Data). Ou seja, cada um inferirá, pelo toque em parte específica na anatomia do “proboscídeo”, o que aquilo representa.  Quem tocar no “rabo”, poderá achar que é uma cobra, quem encostar na perna, inferirá que é uma árvore. No fundo, a metáfora sugere que dependendo da unidade organizacional, cada uma terá percepções específicas com relação à GD. Para os CEO´s e outros C*O, podendo ser o asterisco a letra “F”(Finacial), “M”(Material),  “D”(Data), etc haverá a expectativa de que a GD proveja os dados com os devidos atributos que lhes permitam tomadas de decisões seguras, além de conforto nos aspectos exigentes das regulações. Para os usuários de negócios(business users), haverá a expectativa de que o recheio dos softwares usados nos seus domínios, como CRM, por exemplo, estejam perfeitos nos seus atributos. Pouco adianta uma poderosa ferramenta de CRM, como Siebel/Oracle com dados frágeis sobre clientes  a habitá-la. Para a equipe de TI, a GD deverá representar a expectativa de dias melhores no sentido de que os modelos de dados serão integrados, respeitados e não haverá correria para a duplicação de bases de dados, visando atender apelos de poderosos. Além disso, no exemplo de Sarsfield, um modelo de dados com atributos minimamente qualificados, não permitiria um campo de endereços como  Judy Johnson, 44 Main Street. LDIY, Dedham, Massachussets 02026. O que há de estranho no exemplo? Simplesmente as letras LDIY acopladas ao endereço, para designar “ large dogs in yard”, ou seja avisando que há cachorro grande no jardim.....Definitivamente o campo de dados  do endereço não tem como função colateral criar sinalização de perigo para entregadores...Francamente...A venda da GD pelos seus benefícios deve passar pela minimização de efeitos adversos produzidos por dados de má qualidade. Os exemplos são clássicos, grande parte oriundo da área de CRM, como a perda de clientes pelo envio do “junk email”, ou seja o excesso de comunicação desagradável; os problemas de envio de produtos comprados devido aos dados pouco controlados no nível de estoque que acabam resultando em tempos de entregas maiores do que o contratado e a impossibilidade de se gerenciar diversas pessoas num só mapeamento de comunicação, abrindo a porta para espertalhões que criam ligeiras variações em nomes/e-mails, a fim de dissimular como sendo pessoas diferentes, quando na realidade não são. Além disso, cita Sarsfield, uma empresa poderia concorrer com outra que no fundo seria uma divisão dela mesmo num outro país, devido à falta de integração de dados e de processos. Outro benefício tangível da GD é uma forte aproximação da área de TI com a de negócios, visto que a GD somente alçará voo consistente caso esse matrimônio se concretize. A capacidade de materializar o casamento das informações necessárias ao negócio(business) com os dados que poderão provê-la(TI) é um dos grandes objetivos da GD. No fundo, o que Sarsfield aponta nesse tópico é o mesmo rosário de vantagens  da GD que conhecemos de cor. O problema é como  implementá-la com efetividade, e sucesso, conforme discutido abaixo. 

c)Os fatores de sucesso na implementação da GD
Sarsfield divide os FCS em duas categorias: os fatores genéricos e específicos.
Os Fatores de sucesso genéricos são, segundo ele:

1)Consertar os problemas de dados
A proposta de Sarsfield vem ao encontro de muitas outras que advogam o início de tudo através de um ressonante impacto produzido por um levantamento sobre a qualidade dos dados. A exposição da real situação dos grandes cadastros de dados mestres e referenciais pode ser elemento de profunda sensibilização na “venda” da GD. Isso pode ser feito, como já discutimos, através de um projeto de data profiling, que traga a realidade “fotográfica”  e mensurada sobre os dados da empresa. O TDQM, processo do MIT tem uma ampla descrição de alternativas de profiling, inclusive através de pesquisa qualitativa, em contraponto ao levantamento quantitativo. Hoje os grandes provedores de soluções de dados, como IBM por exemplo, já oferecem camadas para análise e”profiling” de dados.

2)Desenvolver um processo repetido(repeatable)
Essa proposição de Sarsfield também é coerente com a implementação de processos de qualquer natureza. O CMMI e o MPS.BR, modelos para implementação de processos de melhoria de software, trilham níveis gradativos de maturidade, buscando a criação de processos que possam ser aplicados independentemente de pessoas e do tempo. Um programa de GD deve ser composto de vários projetos que deverão seguir processos aprovados e bem documentados. Por exemplo, dados de coleta de clientes vindo dos diferentes  pontos de contato da empresa, deverão seguir um processo de unificação, limpeza, consolidação,etc capaz de ser repetido em ciclos subsequentes. Um ponto importante e corroborado por Sarsfield é que  a GD deve observar o todo mas começar pequena. Projetos agigantados são fortes candidatos ao fracasso e uma boa alternativa é fazer da GD, depois de amadurecida e escrita, uma receita que seja parte ativa de todos os projetos da empresa.

3)Gerenciar as alterações
A ideia aqui é mostrar que as empresas são dinâmicas, mudam constantemente, via crescimento, fusões, partições, sendo por vezes alcançadas por novas regras e regulamentações e que a GD deve estar pronta para ser também rápida no gatilho. De que forma? Por exemplo, oferecendo processos estáveis e repetíveis, como visto acima, e mantendo a empresa ciente de possíveis alterações nos processos de dados. Em suma, ter um processo que possa assimilar mudanças na ecologia empresarial.

4)Coordenar esforços com a área de negócios
Um dos fatores fundamentais é que o processo de GD seja coordenado a quatro mãos com as iniciativas de negócios. Entender que o poder dos dados somente pode ser efetivamente aferido pelos usuários que os utilizam como combustível nos processos de negócios é fundamental. A área de TI tem melhorado essa percepção de parceria, mas em muitos casos, ainda se firma nos conceitos do velho e indivisível CPD...

5)Definir os conceitos de propriedades de dados (data ownership)
Essa talvez seja, das implementações operacionais, a mais desafiadora. Definir claramente as propriedades de dados , separando o âmbito departamental e o organizacional. Definir o que deve ser controlado no contexto da GD,  e com qual nível. Normalmente as proposições estruturais de GD passam por um Comitê de alto nível, composto de executivos de áreas estratégicas, que além de ter o poder de observadores e reguladores, decide questões críticas não resolvidas em instâncias inferiores. Embaixo, coloca-se uma estrutura tática/operacional que seria como um DMO, um escritório de dados, ou algo como um CDO(Chief Data Officer) que faria a definição e o acompanhamento dos processos, regras, políticas aprovadas pelo Comitê e praticadas pelas áreas de negócios da empresa. Depois teríamos uma 3ª camada, composta pelos data stewardship, que seriam os gestores de dados num nível de negócios, e , logicamente localizados nas unidades organizacionais. Complementando, teríamos os data custodians, ou os mantenedores de dados, mais próximos do ambiente físico e localizados na TI. Essa é uma das muitas possíveis e sugeridas estruturações de GD e cada conformação vai depender da empresa, do seu apoio e da sua cultura para processos e controles. O fator de sucesso específico apresentado é tão óbvio, quanto difícil de ser obtido:prover medidas de ROI(retorno) sobre as ações de GD. Se nenhum desses pontos acima mencionados forem suficientes para justificar a adoção de Governança de Dados, outros mais específicos deverão ser procurados na empresa. Mas não se iluda,  que esses estarão muito próximos.


Continua no próximo post