RECEBA O CONTEÚDO DO BLOG NO SEU E-MAIL!

Data Quality: processos, pessoas e ferramentas

Big Data/Analytics | Publicado por Time MJV on 13/jan/2014 15:54:00

Embora muitas organizações ainda associem o Data Quality ou Qualidade dos dados a uma ferramenta poderosa da Tecnologia da Informação, o fato é que ele não existe sem processos, pessoas e ferramentas. Essa tríade é inerente a ele, e exige cada vez mais profissionais capacitados para trabalhar todo o conjunto a que ele está envolvido. Tal conjunto visa, sobretudo, garantir que os dados armazenados sejam:

- Padronizados;
- Completos;
- Íntegros;
- Aderentes às regras de negócios;
- Únicos.

E como medir a Qualidade dos dados?

Geralmente, ela possui 6 dimensões:

1) Completude - Medir se o dado está completo. Um endereço sem número, por exemplo, pode gerar um grande impacto financeiro às empresas, quando do envio de correspondências aos seus clientes.

2) Conformidade - Dados armazenados em formato padrão. Existem vários padrões de data de nascimento, por exemplo. É preciso, então, colocar todos esses dados de forma igual.

3) Consistência - Dados que dão informações conflitantes como, por exemplo, a questão de gênero: masculino e feminino. Se a empresa é uma seguradora de automóveis, certamente o fato de o nome do cliente ser masculino e o sexo feminino irá impactar no valor do seguro.

4) Precisão - Dados que estão incorretos ou desatualizados. São exemplos dessa dimensão produtos e preços que estejam com valores muito abaixo do real ou muito acima.

5) Duplicidade - Dados que estão repetidos. Há empresas que chegam a ter mais de cinco registros do mesmo cliente.

6) Integridade - Quando há dado de referência íntegro ou faltando. Se todos os dados de cadastro, de endereço e de produto de um determinado cliente estão íntegros, essa dimensão está completa.

Como falamos, o Data Quality envolve processos e não somente uma ferramenta. Eles precisam ser implementados para uma correta implantação de Data Quality numa empresa.

Por onde começam os processos de Data Quality?

Geralmente, por meio da identificação de padrões e problemas na Qualidade de dados. A simples implementação de um profile em uma base pode trazer muitos ganhos para qualquer integração de dados. O profile, que é uma das técnicas do Data Quality, faz a descrição real do estado do seu dado.

Para saber mais sobre o assunto, consulte um de nossos consultores de Data Quality aqui.

Categorias: Big Data/Analytics

Deixe seu comentário

Receba o conteúdo do blog no seu e-mail!

Posts recentes