Total de visualizações de página

sábado, 6 de outubro de 2012

Governança de Dados-Parte IX- Visão Sunil Soares/IBM sobre Governança de Dados-Segunda parte-cont. do post anterior


4)Com os resultados do passo anterior, construir um Plano de GD, com foco nos  “Ps” como Pessoas e Papéis, Processos, Patrocínio, Procedimentos e Planos detalhados . O objetivo do plano é “encaminhar soluções” sobre as lacunas mostradas  no passo anterior. Poderá ser um Plano ou um programa contendo vários projetos.

5)Definir uma estrutura organizacional: Nesse passo, deverão ser pensadas as formas de estruturação de pessoas e papéis, a fim de se criar o arcabouço organizacional da GD. Uma das propostas mais encontradas é a definição de três(3) camadas: No alto, um Conselho, formado por pessoas influentes nas áreas “targets” do programa, como vice-presidentes de marketing, ou de finanças, ou de logística, etc. Esse conselho será o tira-teima dos problemas que certamente aparecerão em função da falta de “ownership” de dados nas empresas. No segundo nível aparece o que poderia ser chamado de DMO-Data Management Office, que seria uma gerência constituída por uma liderança tática definida, vindo da área de business, com participação de elementos da TI. Essa camada, representa o nível gerencial tático sobre os dados da empresa, da mesma forma que os PMO estabelecem controles sobre os projetos da companhia. Na terceira camada, no nível mais operacional, ficariam os “gestores de dados”, ou data steward, elementos escolhidos e lotados em cada área de business envolvida no projeto, com o objetivo de aplicar os conceitos de gestão sobre os dados daquele domínio. Seguirão os processos e regras definidas nos níveis hierárquicos anteriores. Há algumas proposições sobre o tipo de Data steward(gestor de dados):
·         Orientado a sistemas: Essa abordagem  define o gestor(steward) associado a um ou mais sistemas de informações. Por exemplo, um gestor de dados que tomaria conta (dos dados) dos sistemas de Faturamento e Arrecadação do SAP para empresa “utilities”. Normalmente ficam situado no âmbito da TI-Tecnologia de Informação, o que pode sugerir dificuldades na venda da idéia para toda a empresa ;
·         Orientado a unidade organizacional: Essa abordagem define o gestor de dados num nível funcional, dentro de uma unidade da empresa. Por exemplo, a área de Faturamento poderia ter um data steward, que seria o gestor para os dados que circulam por aquela unidade organizacional. Ele estaria gerindo outros dados de outros sistemas, que estivessem naquela mesma unidade da empresa, expandindo o escopo da proposição anterior;
·         Orientado para Assunto: Essa abordagem define o gestor de dados num âmbito corporativo, ficando com a incumbência de gerir o dado de forma mais ampla, num conceito de Entidade, ou “assunto”. Isso perpassaria várias unidades organizacionais e vem ao encontro do conceito de MDM(Master Data Management) . Assim um gestor seria responsável pelo assunto Cliente, Fornecedor ou Conta, etc, com forte associação com o conceito de dados mestres. Tem a vantagem da visão mais completa, porém sugere maiores dificuldades na sua implantação.  Essas diferentes estratégias de definição de gestores de dados, tem graduações proporcionais de dificuldades de implementação e dependerão da maturidade da empresa. A mais facilmente implementada é aquela mais focada em sistemas de informações e a mais difícil esta relacionada com a visão mais corporativa de dados e sua gestão como um ativo da empresa.
·         Ver os conceitos ilustrados nas figuras abaixo (final do texto) com a separação em 3 níveis hierárquicos e o posicionamento organizacional dos Gestores de Dados, conforme algumas soluções: Visão corporativa(Assunto),Visão de Unidade Organizacional e Visão de Sistema de Informação.
6,7,8)Entender os dados, construir o Dicionário de Dados e criar um repositório de metadados podem ser vistas como etapas de prospecção e mergulho nos dados existentes naqueles domínios em estudo, objetivando o pleno entendimento de seus depósitos, campos, descrições, dicionários, etc, visando a criação de uma camada documentacional . O Dicionário de dados ajuda no entendimento dos dados existentes e o repositório de metadados seria a sua extensão com a criação e merge  dos metadados técnicos (advindos das inspeções e descobertas de BD), e dos metadados de negócios, advindo dos DD, caso existentes. Os principais passos para se alcançar esses objetivos seriam:
·         Baseado no domínio de estudo, identificar as principais fontes de dados, ou seja: tabelas de bancos de dados, tabelas dimensões de sistemas analíticos, arquivos independentes, arquivos manuais, etc
·         Identificar e entender  os principais tipos de dados, segundo a classificação:
o   Dados Mestres, ou seja  os objetos, pessoas, clientes, fornecedores, vendedores, colaboradores, representando os diversos papéis de relacionamentos  da pessoa física ou jurídica com a empresa. Alguns autores ainda classificam os dados mestres de acordo com a sua volatilidade. Por exemplo, dados mestres do tipo Contrato normalmente são mais estáticos depois de criados, enquanto que dados mestres de Clientes podem ser mais voláteis, quando esses elementos|(clientes) evoluem no seu ciclo de vida;
o   Dados Transacionais, ou seja aqueles normalmente com uma ou mais referência temporal, como Ordens de pedido, Notas fiscais, Ordens de compra, lançamentos,etc;
o   Dados de Referência, ou seja lista de valores padronizados (paises, estados, datas, códigos, etc), usados em codificações ou decodificações, com o objetivo de trazer maior clareza sobre a definição do dado. Alguns exemplos: dados de códigos postais(CEP) com associações com unidades geográficas, dados de códigos de padrões universais de produtos e serviços, como UNSPSC( convenção hierárquica, definida e adotada pelas Nações Unidas - de âmbito e aplicação mundial, usada para classificar todos os tipos de produtos e serviços). Os dados de referência estão próximos dos dados mestres, com um sabor mais de origem  externa(nem sempre)  e codificado. Ambos (Mestres e Referências) são fundamentais na geração dos dados transacionais
o   Metadados, ou seja os dados sobre os dados, que podem ser técnicos, como nome, comprimento, lay-out, array, etc ou de  negócios que são usados para aplicações no entendimento do negócio(títulos, nomes de telas, estatísticas, páginas web, etc), ou metadados de auditoria, com dados como tipo de informação para rastreamento, visando proteção, recuperação, quem, quando, como , o porquê, audit, log, etc;
o   Dados Históricos, que são dados de variadas naturezas(Mestres, Transacionais), com referência passada de tempo, normalmente não mais alteráveis e usado como registro de fatos acontecidos e  de valor histórico;
o   Dados Temporários que são dados usados em certas circunstâncias técnicas, na memória de sistemas, por exemplo, como elemento de otimização de tempo, performance, constantes, etc.
·         Criar os modelos de dados, casos inexistentes, ou entendê-los casos existam, a fim de produzir a visão documentacional composta por entidades, relacionamentos e atributos chaves e  atributos descritivos;
·         Criar os repositórios de metadados, com os elementos do tipo técnico, de negócio ou de auditoria.
9)Definir métricas: Esse passo é fundamental como estabelecimento de baselines que serão confrontadas após os ciclos dos programas de GD, que objetivam melhorar a performance dos dados. Serão as definições de KPI´s  de natureza técnica e de negócios. Os conceitos fundamentais sobre medidas e medições são:
      Medidas são valores numéricos que representam extensão, quantidade, tamanho, dimensão ou capacidade de um produto ou de um processo. Por exemplo, são expressas por  metro linear para comprimento, escala Richter para intensidade de terremoto, metro cúbico para volume, quilograma para peso, contadores para registros/eventos  para medidas diversas dentro do processo de desenvolvimento de sistema, etc. São normalmente definidas por convenção;
      Métricas representam o valor resultante do ato de colocar as medidas numa escala de relatividade. Por exemplo, metros cúbicos/hora, metros/segundo, quantidade de não conformidades (NC) na Fase de Elaboração, Esforço Realizado e Esforço Planejado em homens/hora estimado no mês de setembro de 2007, no projeto XABC, etc.;
      Medição representa o ato ou processo de levantar medidas/métricas sobre produtos e processos com o objetivo de prover informações para uma análise e/ou tomada de decisão;
      Indicadores são informações relacionadas a uma medida, métrica ou combinação de métricas que pode ser utilizada para ter uma compreensão de uma certa entidade objeto da análise;
      Um exemplo que ilustra os conceitos: quando você realiza uma avaliação para começar a “malhar” numa academia, uma das métricas obtidas é o seu índice de massa corporal, que indica se você está com seu peso ideal ou não. Para tal, duas medidas são importantes: altura (H) e peso (P). A medição é o ato de levantar essas duas informações. Existe uma métrica chamada “índice de massa corporal (IMC)” que é calculada, em função das duas medidas, segundo a seguinte fórmula: IMC = P / H2.  A partir dessa métrica, foram estabelecidos indicadores que apontam se um adulto está acima do peso, se está na faixa aceitável ou abaixo do peso ideal. Por exemplo, para que uma pessoa seja considerada dentro do peso normal, o IMC deverá estar entre 18,5 e 25.  No ambiente de Processos de Software existem várias medidas que poderão ser obtidas, dentro dos domínios de tempo (tempo estimado e tempo realizado para certa atividade ou conjunto delas), custo (custo estimado e custo realizado para certa atividade ou conjunto delas), qualidade (número de defeitos observados em certas atividades ou conjunto delas), esforço (esforço em homens/horas estimado e realizado para certa atividade ou conjunto delas). As métricas poderão ser obtidas por operações realizadas entre essas medidas. Por exemplo, o valor agregado é definido como a percentagem de conclusão de uma atividade declarada no ato da medição multiplicada pela quantidade de horas planejadas para a realização daquela atividade. É importante definir para cada medida/métrica os limites ou faixas que representem valores bons, aceitáveis ou inaceitáveis. Por exemplo, se a densidade de defeitos for menor do que X defeitos por ponto de função, ela é considerada boa. Com valores entre X e Y ela é considerada mediana, e maior do que Y ela é considerada inaceitável. Normalmente, para essas situações de limites críticos, o processo de medições da empresa deverá definir ações a serem implementadas, visando a correções ou ajustes a respeito.
Do ponto de vista de GD as métricas deverão centrar em informações que agreguem valores ao negócio, principalmente no que tange a aspectos de dados relacionados com conteúdo, disponibilidade, integridade, segurança, etc e que possam implicar riscos e perdas no escopo do negócio, de sua credibilidade, de  aspectos de aderência a padrões,etc. Por exemplo, um campo código que indique uma classificação industrial ou geográfica poderá ter implicações sérias de riscos, caso não estejam adequadamente preenchidos. Uma análise de risco, numa instituição financeira, aplicada por tipo de indústria, poderá perder o seu valor caso esses códigos não esteja devidamente corretos e íntegros. O mesmo se aplicaria para estratégias a serem aplicadas em áreas de um país, com códigos regionais frágeis e sem qualidade. Um número de telefone, elemento de informação que pode ser importante em ações de marketing, por vezes, deverá ser validado contra arquivos externos oferecidos por provedores, como companhia de telecomunicação. O quanto dessas verificações resultaram em acertos poderia ser uma métrica sobre campos de telefones. Da mesma forma, a incidência de registros duplicados de fornecedores, vendedores, colaboradores, etc pode ser uma medida a se gerenciar, buscando-se gradativamente a sua minimização. A verificação de data de nascimentos de grandes arquivos mestres pode apontar erros como um número excessivo de pessoas com mais de certa idade, ou com idades impossíveis. Um medida sobre essas discrepâncias poderia ser feita em sistemas que apoiam linhas de negócios onde a idade do cliente, paciente, colaborador é considerada importante. Consistências em CPF ou no número da carteira do plano de saúde podem ser importantes em certos domínios de negócios. Essas métricas estariam, de certa forma,  atreladas aos aspectos de negócios da empresa. Outras métricas, poderiam ser definidas, associadas aos aspectos de documentação dos dados(metadados), como ausência de informações de origem de certo arquivo, no que são chamados metadados órfãos, ou seja não trazem os dados completos de sua origem. Por exemplo, um arquivo documentado sem a informação do seu departamento de origem(orfandade ou a ausência de linhagem dos dados). Métricas também podem ser definidas em certos assuntos emergentes como dados não estruturados, com medições de percentagem de documentos de negócios que estão sendo preparados para buscas de text mining. Indicadores de BI, como número de usuários, relatórios e suas execuções, por área de negócios, grau de atendimento da área de BI, etc. As métricas, ensina Sunil Soares, no seu Selling Information Governance to the business practices, devem ser D.A.T.A, ou sejam: Digestible, ou facilmente digerida por quem as consome. Para tal deve ser concisa, clara e objetiva. As métricas devem ser Actionable, ou seja devem sugerir ações concretas quando atingirem certos limites estabelecidos; Timely, ou disponíveis no tempo, ou seja devem ser entregues no menor tempo possível, encurtando a distância entre o ponto de sua captura e o momento de sua análise e consumo; e Auditable, ou auditável, no sentido de que os números obtidos naquela métrica devem ser rastreados de volta ao ponto da coleta ou captura, a fim de oferecer uma tonalidade de confiabilidade. 
10)A partir desse ponto, o road map da IBM, sugere trilhas paralelas, que poderão ser projetos fundamentais do Programa de GD, como: Governança de Dados Mestres, com a definição de gestores de dados de áreas de domínios envolvidas, gerenciamento da qualidade dos dados desses DM analisados, e definição de  soluções arquiteturais para MDM dessas fontes. 

Figuras: