Resumo de Estatística - Análise Discriminante

Análise Discriminante

Análise Discriminante: Conceito

A Análise Discriminante é uma técnica estatística multivariada usada para classificar observações em grupos pré-definidos e entender quais variáveis melhor discriminam essas categorias. É amplamente aplicada em concursos para questões sobre classificação e redução de dimensionalidade.

Objetivos Principais

  • Classificação: Alocar novas observações em grupos já existentes com base em variáveis preditoras.
  • Discriminação: Identificar quais variáveis melhor separam os grupos.
  • Redução de dimensionalidade: Criar combinações lineares (funções discriminantes) que resumam as diferenças entre grupos.

Tipos de Análise Discriminante

  1. Linear (LDA): Assume homocedasticidade (variâncias iguais entre grupos). Usa funções lineares para separação.
  2. Quadrática (QDA): Relaxa a suposição de homocedasticidade, permitindo variâncias distintas. Mais flexível, mas exige mais dados.

Pressupostos Importantes

  • Normalidade multivariada das variáveis preditoras.
  • Homogeneidade das matrizes de covariância (para LDA).
  • Ausência de multicolinearidade entre as variáveis.

Aplicação em Concursos

Foque em:

  • Interpretação de funções discriminantes.
  • Cálculo de escores discriminantes.
  • Análise de taxa de erro de classificação.
  • Comparação entre LDA e QDA.

Fórmula-Chave (LDA)

Função Discriminante Linear:

D = b0 + b1X1 + ... + bnXn

Onde D é o escore discriminante e b são os coeficientes calculados para maximizar a separação entre grupos.