Questões de Data Mining (Banco de Dados)

Limpar Busca

A respeito da técnica de Data Mining, utilizada em bancos de dados, é correto afirmar que

  • A consiste na exploração e análise de dados, visando descobrir regras e padrões com significado relevante para as aplicações de uma instituição.
  • B não tem aplicação em sistemas de bancos de dados empregados em instituições financeiras.
  • C só pode ser aplicada, de forma eficiente, em dados provenientes de bancos de dados orientados a objetos.
  • D se aplica, exclusivamente, em sistemas de bancos de dados utilizados em empresas de mineração de metais.
  • E consiste em se aplicar técnicas de compactação de dados, visando obter maior capacidade de armazenamento.

Um analista de dados da AgSUS sabe que a detecção de anomalias, ou detecção de valores discrepantes, é a identificação de uma observação, evento ou ponto de dados que se desvia do que é padrão ou esperado, tornando-o inconsistente em relação ao resto do conjunto de dados. Relacione os tipos de anomalias de dados às suas respectivas definições.

1. Anomalias não intencionais.
2. Anomalias pontuais.
3. Anomalias contextuais.
4. Anomalias coletivas.

( ) Essas anomalias, também conhecidas como valores discrepantes globais, são pontos de dados individuais que estão muito fora do restante do conjunto de dados. Um exemplo desses tipo anomalia é um saque de conta bancária que é significativamente maior do que qualquer um dos saques anteriores do usuário;
( ) Essas anomalias envolvem um conjunto de instâncias de dados que juntas se desviam da norma, mesmo que as instâncias individuais possam parecer normais. Um exemplo desse tipo de anomalia seria um conjunto de dados de tráfego de rede que mostra um aumento repentino no tráfego de vários endereços IP ao mesmo tempo;
( ) Essas anomalias são pontos de dados que se desviam da norma devido a erros ou ruído no processo de coleta de dados. Esses erros podem ser sistemáticos ou aleatórios, originados por problemas como sensores defeituosos ou erro humano durante a entrada de dados. Esse tipo de anomalia pode distorcer o conjunto de dados, dificultando a obtenção de insights precisos;
( ) Essas anomalias são pontos de dados que se desviam da norma dentro de um contexto específico. Essas anomalias não são necessariamente valores discrepantes quando consideradas isoladamente, mas se tornam anômalas quando vistas dentro de seu contexto específico. Por exemplo, considere o uso de energia. Se houver um aumento repentino no consumo de energia ao meio-dia, quando normalmente nenhum membro da família está em casa. Este dado pode não ser um valor discrepante quando comparado ao consumo de energia pela manhã ou à noite (quando as pessoas geralmente estão em casa), mas é anômalo em relação ao horário em que ocorreu.

A relação correta, na ordem dada, é:

  • A 4 – 3 – 1 – 2.
  • B 2 – 4 – 1 – 3.
  • C 3 – 2 – 4 – 1.
  • D 1 – 2 – 3 – 4.
  • E 3 – 4 – 1 – 2.

Julgue o seguinte item, relativo a técnicas de visualização de dados em business intelligence, a data lakes e a regras de associação em mineração de dados.


Em mineração de dados, as regras de associação podem ser utilizadas para identificar combinações recorrentes entre argumentos jurídicos e decisões judiciais, revelar padrões entre tipos de ação e desfechos processuais, e auxiliar na recomendação de precedentes com base em casos semelhantes.

  • Certo
  • Errado

Uma rede de supermercados deseja entender os padrões de compra dos clientes para organizar melhor seus produtos e otimizar suas estratégias de vendas. Para isso, a equipe de análise de dados decidiu utilizar um algoritmo de descoberta de regras de associação para identificar itens, frequentemente, comprados juntos.


Assinale a alternativa que representa a métrica fundamental para avaliar a relevância de uma regra de associação.

  • A Lift.
  • B Erro médio absoluto (MAE).
  • C Suporte.
  • D Coeficiente de correlação de Pearson.
  • E Gradiente descendente.

Em relação ao data warehouse, ao data lake e ao tratamento de dados, julgue o item seguinte.


A distância de Mahalanobis é uma medida estatística que indica quantos desvios‑padrão um determinado valor está da média. Ela é utilizada para identificar outliers em dados multidimensionais.

  • Certo
  • Errado