Extrair conhecimento útil a partir dos dados, para resolver problemas de negócios, pode ser tratado de forma sistemática, e a partir de uma grande massa de dados, utilizando a tecnologia, é possível encontrar atributos descritivos informativos de valores de interesse.
O processo de mineração de dados tem como objetivo encontrar padrões a partir de um conjunto de dados, pois se olharmos muito para um conjunto de dados, vamos encontrar alguma coisa. No entanto, é importante formular a solução ideal de mineração de dados e avaliar seus resultados, pensando cuidadosamente sobre o contexto de utilização.
Neste artigo, falaremos sobre as 7 principais tarefas de mineração de dados.
Classificação e Estimativa de Probabilidade
A tarefa de classificação tenta prever, para cada indivíduo, a qual conjunto de classes ele pertence.
Já a estimativa de probabilidade cria, com base na classificação, um modelo de pontuaçãoque representa a probabilidade que o indivíduo, de fato, pertença àquele conjunto de classes.
Um exemplo de pergunta de classificação seria: "Entre todos os contatos em nossa base, quais possuem maior probabilidade de responder uma determinada oferta?". Nesse exemplo, primeiro devemos classificar as entidades em classes [vai responder] e [não vai responder] e, na sequência, calcular a probabilidade de pertencer a classe designada.
Regressão
A regressão tenta estimar ou prever, para cada indivíduo, o valor numérico de alguma variável ou atributo.
Mas qual a diferença entre classificação e regressão?
A classificação busca prever se alguma coisa vai acontecer. Já a regressão busca prever quanto de alguma coisa vai acontecer.
Combinação por similaridade
Essa tarefa tenta identificar indivíduos semelhantes com base em dados conhecidos sobre eles, e é muito utilizada em e-commerce, redes sociais e plataformas de streaming para criar recomendações.
Quem nunca estava comprando online e recebeu aquela mensagem "Pessoas que compram esse produto também compram...", ou, ainda, adorou um filme ou uma série recomendada pela Netflix?
Agrupamento
Tenta reunir indivíduos de uma população por similaridade, mas não é motivado por nenhum propósito específico. Por exemplo, analisar a carteira de clientes , para compreender se os mesmo formam grupo naturais.
A tarefa de agrupamento pode acontecer com base nos atributos que descrevem os indivíduos (características), ou com base em transações similares .
Para agrupamento por similaridade de transações , damos o nome de agrupamento de coocorrência, e esse tipo de agrupamento é utilizado para saber, por exemplo, quai s produtos geralmente são comprados juntos (cross selling).
Perfilamento
É aquela que busca descrever comportamentos, ou seja, tenta caracterizar o comportamento típico de um indivíduo, classe ou população.
Por exemplo, conhecer qual o uso típico de celular ou redes sociais em uma determinada clas se de clientes.
Previsão de vínculo
Como o próprio nome já diz , essa tarefa tenta prever ligações entre itens de dados, sugerindo que um vínculo deveria existir , e estimando a força desse vínculo.
Como exemplo, nas redes sociais, você pode receber uma recomendação do tipo: "Você e fulano compartilham 10 amigos . Talvez você queira ser amigo de fulano". Isso é um exemplo de aplicação da previsão de vínculo.
Modelagem causal
Muito utilizada no marketing digital, essa tarefa nos ajuda a compreender quais acontecimentos ou ações realmente influenciam outras pessoas. Por exemplo, podemos utilizar o teste A/B e identificar quais atributos influenciaram cada grupo.
Gostou do conteúdo? Compartilhe esse conhecimento com sua rede 🚀
Comments