RECEBA O CONTEÚDO DO BLOG NO SEU E-MAIL!

Seu negócio mais competitivo com Data Science e Data Mining

Big Data/Analytics | Publicado por Time MJV on 2/jul/2015 13:40:00

0.10

A velocidade da coleta de informações nas empresas é muito maior do que o seu processamento ou análise. Muitas vezes as organizações, por possuírem dados, têm a sensação de que estão bem informadas, porém esses bytes de nada servem se não forem analisados de forma correta e em tempo hábil. Por isso a importância cada vez maior do Data Mining e do Data Science.

Por que Data Science?

O Data Science utiliza ferramentas de Data Mining nos dados e revoluciona o processo de tomada de decisões em um negócio. Então por que usar o Data Science?

  1. Um estudo da Sloan School of Management mostrou que há evidências concretas do retorno do investimento com o Data Science nas empresas. Aquelas que adotam processos decisórios baseados em métodos analíticos obtiveram ganhos de produtividade entre 5 e 6%.
  2. Devido a redução gradual do custo de armazenamento, com opções como a nuvem (cloud), é crescente o volume de dados armazenados sem nenhum valor ao negócio.
  3. A convergência entre os ambientes operacionais e analíticos nas empresas modifica a experiência dos usuários e a velocidade das tomadas de decisão.
  4. Há tipos de dados considerados não amigáveis aos processos analíticos tradicionais, como os dados textuais, imagens e áudios obtidos das redes sociais.
  5. O Data Mining é capaz de revelar o conhecimento implícito nos bancos de dados de uma organização, podendo fazer uma análise antecipada e prever tendências ou comportamentos, permitindo aos gestores a tomada de decisões baseada em fatos.

E o que é o Data Mining?

Data Mining significa, literalmente, Mineração de Dados, e faz parte do Data Science.O Data Mining é o uso de ferramentas computacionais, usualmente baseadas em matemática ou estatística, para a extração de conhecimento a partir de dados de uma empresa.

Muitos Data Scientists já saem criando algoritmos e códigos, e então descobrem que aquilo não era exatamente o desejado pelo cliente, seja ele interno ou externo. Para isso há o CRISP-DM (Cross Industry Standard Process for Data Mining), um modelo de processo para uma visão holística do ciclo de vida do projeto.

A Metodologia CRISP-DM reúne as melhores práticas para que essas ferramentas de Data Mining sejam usadas da forma mais produtiva possível. CRISP-DM pode ser aplicado ao analisar dados comerciais, financeiros, de recursos humanos, produção industrial, serviços prestados e outros. Confira como funcionam as 6 etapas:

Processo de Consultoria em Data Science com CRISP-DM

42% das empresas que fazem Data Mining utilizam o CRISP-DM para minerar bem seus dados. Veja abaixo o resumo desse processo:

CRISP

Passo 1: Entendendo as Necessidades do Negócio

Evidentemente é fundamental que haja conhecimento do problema a ser resolvido no negócio, embora esse problema possa mudar ao longo do processo.

Isso pode até parecer óbvio mas, em muitos casos, essa demanda vem de uma forma ambígua. Essa é a fase de análise criativa, onde o aspecto humano é fundamental para um bom entendimento do problema real a ser resolvido.

Passo 2: Compreendendo os dados da Empresa

Os dados disponíveis são o material bruto sobre o qual a solução será construída.

Muitas vezes nem a empresa sabe o potencial dos seus dados. Esse olhar é para identificar qualidades e limitações dos dados disponíveis, verificando até mesmo se os dados são suficientes para minerá-los.

Nesse caso, pode-se avaliar se há outras fontes de dados disponíveis e se é possível adquiri-las.

Passo 3: Preparação dos Dados

Muitas empresas subestimam o esforço necessário nessa fase de preparação dos dados para que eles estejam perfeitamente adequados à mineração.

As ferramentas analíticas usualmente exigem que os dados estejam em formatos específicos e a conversão dos dados é uma das tarefas mais comuns durante a preparação de dados.

Os dados também precisam, muitas vezes, ser limpos e enriquecidos com outras fontes de dados para que possam ser analisados corretamente.

Passo 4: Modelagem

Um modelo é uma tentativa de entender ou representar a realidade sob uma determinada ótica, usualmente de caráter técnico ou científico. É uma construção artificial, onde os detalhes não relevantes são removidos ou abstraídos.

A fase de modelagem é onde as técnicas de Data Mining são aplicadas efetivamente aos dados. É fundamental que toda a equipe tenha um bom conhecimento, incluindo os tipos de técnicas e ferramentas disponíveis.

É comum retornar à preparação dos dados durante essa fase.

Passo 5: Avaliação

A fase de avaliação é para analisar os resultados obtidos, verificar se são válidos e confiáveis e decidir se há justificativa para a realização de novos investimentos.

É fundamental que haja confiança de que os modelos e padrões extraídos dos dados representam situações corriqueiras do negócio e não sejam anomalias ou idiossincrasias. No final das contas, o principal objetivo da fase de análise é garantir que os modelos gerados atendam aos objetivos de negócio inicialmente acertados.

Passo 6: Desenvolvimento

O conhecimento adquirido através da modelagem é organizado e apresentado de uma forma que o cliente possa aplicar.

Os resultados possíveis são novas aplicações, mudanças nos processos da empresa ou até mesmo lançamento de novos produtos.

Categorias: Big Data/Analytics

New Call-to-action

Deixe seu comentário

Receba o conteúdo do blog no seu e-mail!