Total de visualizações de página

segunda-feira, 21 de dezembro de 2015

O estado atual da Governança e Gestão de dados nos EUA-08


Continuação:

#11-Outra palestra que mereceu a atenção foi dada por Danette McGilvray, consultora famosa na área de Qualidade de dados, da empresa Granite Falls. Conversei muito com Danette, com quem já havia estado no Brasil, em evento da QIBras, em 2010 ou 2011, não me lembro. Autora de livros sobre QD(Executing Data Quality projects), Danette mostrou a sua abordagem de detecção de causas raízes de erros de dados, focando na sua identificação e neutralização objetiva e definitiva  ao invés da mera limpeza profilática. Na realidade, é a abordagem de diagramas de espinha de peixe aplicado na detecção de problemas de Qualidade de dados. Trocamos linkedin e ficamos de falar sobre a tradução do seu livro para o português,  que acabou de sair na China.

#12-Também gostei da palestra de Jay Zaidi, com quem conversei muito sobre os aspectos culturais que aproximam e diferenciam os brasileiros e indianos (Isso será tema de um #VejaBem futuro, no FB). O consultor indiano, dono da empresa AlyData, marcou com a frase “Data is the new soil”, adaptação do título de um livro que comprei no EDW/2015 ( “Data is the new oil”). Sua concepção é de que dos dados podem sair ótimos frutos...No fundo, são frases de efeitos para evidenciar a valoração que o elemento “dados” está tendo, nesse momento “Big Data”  da sociedade da informação. A palestra “Change your organization´s culture to make data and information quality a part of its DNA” foi com conteúdo visual muito bem elaborado e centrou sobre os impactos financeiros que os erros de dados podem causar nas empresas. Por exemplo, o custo estimado das perdas com crimes cibernéticos é da ordem de US$ 450 bilhões, enquanto que o de problemas de qualidade pode chegar a mais do que o dobro(maior que US$800 bi). Os  principais fatos causadores ficam em torno da falta de Governança de dados, que gera falta de padrões de qualidade, que se origina na ausência de “accountability” pelos dados e que produz silos isolados de dados. Mais do mesmo nos princípios de Gestão (DM) e Governança de Dados(GD)

#13-Outra palestra muito boa foi a da Telstra, gigante telecom australiana. A empresa mostrou a sua estratégia de dados e me pareceu com boa maturidade em GD. A empresa já teve a figura de CDO, mas que por um erro estratégico, foi colocado sob o CIO. Durou apenas dois anos e poderia ter sido evitado, caso a empresa percebesse que CDO é para tocar os dados, do ponto de vista de negócios e não de tecnologia (TI). Simples assim...Há algum tempo a empresa prima pelo apoio formal à sua equipe de dados, no sentido de incentivá-los à certificações. Na empresa há mais de 20 certificados em IQCP(Information Quality Certified Professional), uma linha concorrente com as certificações CDMP, esta já com alguns profissionais no Brasil. Conversando com a palestrante, chefe da área de dados da gigante australiana, ficou evidenciado o porquê dessa linha IQCP. Ela é presidente do IAIDQ para a região do Middle-East-Pacific, entidade promotora desta certificação. 

segunda-feira, 14 de dezembro de 2015

O estado atual da Governança e Gestão de dados nos EUA-07


#10- No último post, falamos de uma palestra do keynote, da IBM (foi proferida pelo Dr Pyiush Malik, da IBM  e teve o título de “Towards a smarter Data-driven future”) , onde o assunto “Watson”  foi tratado. Aproveito para intercalar nessa série de posts,  a tradução e  outros comentários sobre Watsom, inclusive  uma entrevista feita com os usuários (early adopters) da Plataforma e sua primeiras percepções.  O artigo, escrito por Tom Davenport(*) para o WSJ-CIO(Wall Street Journal-CIO) em dezembro de 2015 e traduzido e comentado por mim, encontra-se no link  http://blogs.wsj.com/cio/2015/12/03/lessons-from-the-cognitive-front-lines-early-adopters-of-ibms-watson/
Watson é uma das mais interessantes tecnologias do século 21. Desenvolvido pela IBM, no seu esforço de criar um exemplo real e aplicável de  uma plataforma de Inteligência artificial, o produto tornou-se famoso por vencer o programa Jeopardy, espécie de QUIZ, em 2011, show que apresentava perguntas genéricas sobre temas amplos, onde  grandes concorrentes profissionais e considerados imbatíveis  atuavam na disputa de prêmios altíssimos. Watson acabou por batê-los todos  A reportagem de Tom Daveport, especial para o Wall Street Journal, aqui traduzida e comentada,  garimpou os primeiros resultados do uso intensivo do Watson em segmentos da indústria, no caso em algumas organizações de “health care”. Várias grandes organizações se predispuseram a oferecer os primeiros “insights”  sobre a aplicação do Watson, no apoio à pesquisas de câncer, ou em desenvolvimento de testes clínicos, além de aplicações na área de veterinária. Organizações de peso nos EUA foram entrevistadas como o Memorial Sloan Kettering Cancer Center(MSKCC)-NYC, MD Anderson Cancer Center (MDACC)-Houston, Clínica Mayo-Minnesota e  WellTok. Esta, é  uma empresa cujo objetivo é a otimização do sistema de saúde e que basicamente objetiva levar o “senso”  de organização ao mundo caótico dos programas de saúde, aparelhos, sensores e outras ferramentas de melhoria nesse campo. Além dessas, também foi ouvida por Davenport uma empresa de produtos veterinários e outra no segmento de seguro de saúde. Todas são espécies de organizações  testadoras parceiras do sistema Watson e tentam , através dele, criar uma base espessa de informações, acessadas e trabalhadas pela Inteligência artificial. A parceria envolve  projetos cuja essência é a ingestão de informações dentro do expertise de cada uma, criando os  chamados  “corpus”, como são denominados os elementos de conhecimentos estruturados no Watson, a partir dos quais ele estabelece e busca inferência, gerando  e transmitindo conhecimento, por mecanismos de interfaces diversas. As perguntas(speech IO) são uma delas. A percepção de Davenport, com relação aos entrevistados é de que o produto é considerado mesmo pioneiro e quebrador de barreiras e paradigmas. Há unanimidade na percepção de sua complexidade no processo de ingestão de dados para a formação dos elementos de conhecimento, mas também na sua capacidade rápida de  aprender . Há vários projetos envolvidos entre esses diversos  parceiros do Watson. Um hospital usa o sistema para testes clínicos envolvendo novos tratamentos, novas drogas, vacinas,etc, enquanto outro o utiliza para estudos de tratamentos de câncer, especialmente de pulmão. Todos os projetos descritos são chamados “moon shots”, jargão para designar aqueles com objetivos ambiciosos e  difíceis de serem realizados com tecnologias atuais. O famoso Hospital MD Anderson, referência mundial em câncer, tem um programa de “moonshots”, cujo objetivo é reduzir dramaticamente a incidência e mortalidade dessa doença. Um deles treina o Watson para aprender sobre  câncer de pulmão, enquanto o outro desenvolve conhecimentos, via Watson,  para melhorar a qualidade dos tratamentos para os pacientes dessa doença, que não possam contar com um especialista. O Hospital MD Anderson intenciona criar um especialista   chamado OEA-Oncoly Expert Advisor, focado em tomada de decisão sobre tratamentos diferentes, sugeridos por especialistas e também visando o compartilhamento desse conhecimentos (de especialistas) no tratamento de um tipo específico de câncer, maximizando os benefícios e melhorando os resultados. Em outras palavras, como disse Davenport, a ousadia do projeto é  criar uma espécie de “arte” de tratar de câncer. Esses projetos, claro, são complexos e levam tempo. Alguns começaram em 2012 e continuam enfrentando desafios . Como, em tese, a doença é também  progressiva no seu desenvolvimento, os conhecimentos sobre ela continuarão sendo desenvolvidos, em projetos subsequentes, que continuarão por muito tempo. Os estágios iniciais desses projetos são de fazer a  ferramenta funcionar, mas na realidade esses projetos demandam profundas mudanças organizacionais e de negócios, além do aculturamento em tecnologias cognitivas, a fim de se chegar a transformações substanciais que possam materializar os resultados esperados. Os recursos colaterais demandados por um programa desses alcançam  aspectos críticos de “gestão/governança  de dados”, como plataformas, compartilhamento, acesso e segurança  de dados, alterações em aspectos de “compliance”  e regulações, além de mudanças culturais médicas cruciais para a condução do programa. Somente a abordagem de aspectos não tecnológicos, como esses, serão capazes de viabilizar e diminuir a complexidade do programa. É o que difere a inovação da transformação , conforme afirma uma das entrevistadas.  As exigências para a ingestão de informações específicas sobre oncologia, tratamentos, fármacos, bem estar, etc implica numa complexidade de estruturação de informações, onde a arquitetura semântica dos dados é fundamental a fim de evitar ou minimizar a ambiguidade . O desafio é justamente o mapeamento do conhecimento intuitivo dos médicos em estruturas formais de informação para serem colocadas nos bancos de dados do Watson. Essa parceria entre o corpo clínico envolvido nos projetos e os engenheiros de informação da IBM é crucial e leva tempo. Os envolvidos nos projetos estreantes(early adopters) pagarão um preço maior pelo ineditismo que demanda a descoberta dos processos a serem aplicados. O desafio central é realizar uma espécie de aprendizado.  Por exemplo, o sistema Watson tem que aprender quais seriam as recomendações seguras e mais adequadas ao caso, como num  possível tratamento de câncer de próstata. A extirpação da glândula, com suas consequências colaterais drásticas ou a introdução de “braquiterapia”, com a simples inserção de sementes radioativas no órgão, preservando todas as suas estruturas, porém recomendado somente em certas circunstâncias. O que hoje está no conhecimento intuitivo dos grandes urologistas, será  transformado em algoritmos cognitivos de uma plataforma de inteligência artificial. O aprendizado, segundo os envolvidos, pode ser mais rápido do que no caso de um aprendiz humano. Segundo uma pesquisadora, em 4 meses e meio o Watson aprendeu os conceitos de veterinária que um aluno levaria de 4 ou 5 anos, numa  formação acadêmica. Um dos maiores desafios é a ingestão e a digestão das informações colocadas no Watson, a fim de torna-lo capaz de aprender e inferir. Nos campos onde as informações estão mais bem estruturadas, com glossários de negócios e definições escritas e registradas, isso torna-se mais rápido. Quando a informação tem um ciclo de vida mais estático, as coisas funcionam melhor. Quando a informação ainda está sendo produzida(casos de pesquisas de tratamentos e drogas contra câncer, ainda em pesquisa e desenvolvimento, há claras dificuldades na ingestão dos dados). Nesses casos , com a inexistência de informações registradas em glossários de termos, o uso do recurso humano direto é aplicado para a introdução/ingestão de perguntas e respostas que comporão o “corpus” de conhecimento do Watson. Novamente os aspectos de “gestão e governança de dados”  influem nos passos dos projetos onde informações geram conhecimentos. Nesse caso em particular, a transferência é de conhecimento, pois envolve as sinapses do agente humano, além das estruturas dos bits existentes nos dados e informações. O Watson também está em constante evolução. Quando do início dos projetos, havia o Watson clássico, vencedor do programa Jeopardy. Hoje, há mais de 32 API´s cognitivas, atuando em campos diferentes, embora haja concentração preferencial em algumas delas. Por exemplo, a maioria deseja o uso da saída das respostas  em inglês. O uso de API´s para análise de imagens obviamente será outra, fundamental nos projetos de tratamentos de câncer, por exemplo. Já o projeto que visa a aplicação do Watson para análise de pedidos de planos de seguro de saúde, não considera a API de Q&A(Perguntas e Respostas) a mais importante. Todos os envolvidos nessa entrevista de Davenport são taxativos em afirmar que o Watson não será um substituto direto do recurso médico. Claramente o objetivo é usar a plataforma como um apoio às estruturas humanas e tecnológicas existentes, focando a plataforma no papel de um grande conselheiro que reúne um volume imensurável de informações, espalhadas por entre pessoas e compêndios médicos diversos  e capaz de sugerir ou responder em segundos dúvidas sobre situações específicas. A posição final, agrupadas todas as percepções colhidas nesses grandes centros do mundo, é que , embora complexo, o projeto é absolutamente real e irá revolucionar os tratamentos médicos e outros tipos de cuidados. A IBM levou 3 anos para dotar o Watson de capacidade para vencer o Jeopardy, mas vencer o câncer é mais complexo, finaliza uma dos entrevistados. Mas o esforço será compensado…Além da área de saúde, com o Watson Health, a IBM investe fortemente no uso do Watson em previsões meteorológicas. Em outubro, a Big Blue fechou um acordo para adquirir a Weather Company(exclui o Weather Channel). A aquisição incluirá o “Weather.com”,  uma vasta rede de pontos de coleta de dados de meteorologia , além de software e de uma equipe de 900 pessoas. O objetivo, claramente definido, é transformar o Watson  Weather em um grande previsor meteorológico e  iniciar o retorno de  parte dos investimentos aplicados no projeto de Computação cognitiva que resultou no sistema. Hoje o Watson é uma unidade independente da IBM, com 2500 empregados e a Big Blue aposta no seu sucesso na indústria da recomendação.

(*)Tom Davenport é professor , com distinção de TI e Gerência do Babson College e pesquisador do Centro de Estudos Digitais do MIT. É um dos mais destacados autores do HBR-Harvard Business Review. É autor de vários livros, sendo o último em co-autoria com  Jinho Kim,  chamado  “Keeping Up with the Quants: Your Guide to Understanding and Using Analytics”.

segunda-feira, 7 de dezembro de 2015

O estado atual da Governança e Gestão de dados nos EUA-06


Eventos: MDM and Data Governance Summit, ocorrido entre 04-06 de Outubro de 2015, em Nova York e  no seminário da IAIDQ-International Association for Information and Data Quality, ocorrido em Baltimore, entre 12 e 14 de Outubro de 2015.

Baseado na participação dos eventos acima, comento,  na forma de pequenas notas(drops), o estágio percebido dos conceitos de Governança de Dados, gestão de dados, MDM,etc. Serão aproximadamente 9 posts semanais...Enjoy..

#09-A primeira palestra “keynote”, foi proferida pelo Dr Pyiush Malik, da IBM  e teve o título de “Towards a smarter Data-driven future”. A sociedade em direção a um futuro mais inteligente, orientado a dados. Típica palestra de abertura de evento, dada pelo responsável pela área “Worldwide Big Data Analytics Center of Excellence da IBM”. Mostrou o futuro da sociedade com o crescimento dos dados e as devidas tecnologias emergentes associadas para tratá-los. Conceitos de Inteligência artificial, Machine Learning, Computação cognitiva, Robótica,etc foram os temas que ilustraram a palestra da 3afa, dia 13 de outubro. A ênfase dada pelo palestrante, em Inteligência artificial me soou um pouco propaganda, pelo fato da IBM ter feito sua grande aposta, nesse campo, no sistema Watson. O Watson, para quem não se lembra é aquele “ente/sistema” virtual de AI(Artificial Intelligence), formado por um gigantesco Banco de dados acoplado a centenas de máquinas e processadores poderosíssimos, capaz de responder a perguntas sobre uma gama de assuntos. Bateu e deixou no chinelo os grandes vencedores do programa “Jeopardy!” , show da TV americana, especializado em “trivias”. Hoje, a IBM desloca o Watson(agora uma unidade de negócios independente)  para o campo de apoio a medicina, meteorologia(acabou de fechar negócios com o Weather Company, por 2 bilhões de dólares),finanças, etc, como um sistema inteligente de apoio. A IBM vem desenvolvendo no Watson  novas capacidades, como melhoria na fala, entendimento de linguagem, reconhecimento de imagens,etc. A IBM sustenta que está criando a AI com computação cognitiva. Aliás, o conceito de AI(Inteligência Artificial) participa como candidata da “escolha” da tecnologia  de sucesso do momento, desde os anos 70, quando comecei com Informática. Nunca levou, sempre ficando na promessa. Essa semana, duas notícias no NYTimes me fizerem pensar se o momento da AI não está mais próximo. Seguinte: A Toiota, gigante do automobilismo mundial, lançou o seu Centro de Pesquisas Toiota, no Vale do Silício, totalmente focado em AI. Investimento de US$1 bilhão de dólares, para os próximos 5 anos. Vai contratar 300 especialistas em “machine laerning”. A grande montadora, foca no desenvolvimento de algoritmos inteligentes, que tornarão o carro um ambiente mais seguro. Seria como o desenvolvimento de um “Guardian Angel”, localizado nos seus automóveis, de olho mais especificamente na população mais idosa, que continua a crescer e a comprar carros. Vai de encontro ao posicionamento da UBer e Google, que apostam nos carros sem motoristas(driverless cars). De quebra a GE, também se junta à IBM, para formar a dupla de empresas (não de TI) que partiram para investimentos maciços em AI. A GE, clama, que em 2020, será uma das maiores produtoras de software do mundo. Veremos..A palestra do Dr Malik foi do  tipo show de informações interessantes, porém contrastada pela seriedade do indiano da IBM... Nas mãos de um apresentador “ bom de palco” teria tido maior sucesso ...