Caros, boa tarde
Aqui é o Barbieri, tudo bem?
Seguinte: estou finalizando o meu 4. livro(agora sobre Governança de dados) e estou precisando de um pequeno favor de todos que passam por aqui. Estou finalizando um capítulo sobre Qualidade de dados e Ciência de dados (como a primeira interfere na segunda) e preciso de contatos de -cientistas de dados- que já estejam trabalhando com projetos dessa natureza, e que possam responder às perguntas simples(abaixo). Com elas, pretendo capturar essa temperatura de conexão entre as duas linhas (gerência/qualidade de dados x ciência de dados). Agradeceria se vc, que me lê neste momento e que trabalha diretamente com -ciência de dados- ou que tem conhecidos neste domínio, pudesse me apontar alguns nomes que pudessem responder. Se necessário, farei o contato. Basicamente são as questões abaixo. Todos que colaborarem terão os devidos créditos, com nome, papel, empresa registrados no meu novo livro.
As perguntas são:
A-Como você garante a qualidade de dados nos seus projetos de Ciência de dados?
B-Como você avalia se o "insight"(resultados) que você obteve do projeto de analytics está "correto" ou "bom" ou "relevante" para o domínio do problema?
C-Quais são os erros típicos cometidos quando analisando dados num projeto desta natureza? Como evitá-los?
D-Como saber se os "data sets" que estão sendo usados são grandes o suficiente para serem significativos?
Peço que as respostas sejam enviadas para o meu email:
carlos.barbieri@gmail.com
A síntese obtida das respostas será publicada aqui neste espaço também.
Agradeço muito,
Grande abraço
Aguardo
CBarbieri