Resumo de Estatística - Regressão Linear

Regressão Linear

Regressão Linear: Resumo para Concursos Públicos

1. Conceito Básico

A Regressão Linear é um método estatístico que modela a relação entre uma variável dependente (Y) e uma ou mais variáveis independentes (X). O objetivo é encontrar uma linha reta (ou hiperplano, no caso múltiplo) que melhor se ajuste aos dados.

2. Tipos de Regressão Linear

  • Simples: Relaciona uma variável dependente com uma única variável independente (Y = β₀ + β₁X + ε).
  • Múltipla: Relaciona uma variável dependente com duas ou mais variáveis independentes (Y = β₀ + β₁X₁ + ... + βₖXₖ + ε).

3. Pressupostos

  • Linearidade: A relação entre X e Y deve ser linear.
  • Homocedasticidade: Variância constante dos resíduos.
  • Independência: Resíduos não correlacionados (ausência de autocorrelação).
  • Normalidade: Resíduos normalmente distribuídos (para inferência válida).
  • Ausência de multicolinearidade: (Regressão múltipla) Variáveis independentes não devem ser altamente correlacionadas.

4. Método dos Mínimos Quadrados

Método para estimar os coeficientes (β) que minimiza a soma dos quadrados dos resíduos (diferenças entre valores observados e previstos).

5. Coeficientes e Interpretação

  • β₀ (Intercepto): Valor esperado de Y quando X = 0.
  • β₁ (Inclinação): Mudança esperada em Y para um aumento unitário em X.

6. Medidas de Ajuste

  • R² (Coeficiente de Determinação): Proporção da variância de Y explicada por X (0 ≤ R² ≤ 1).
  • R² Ajustado: Versão modificada do R² que penaliza a inclusão de variáveis irrelevantes (usado em regressão múltipla).

7. Aplicações em Concursos

Foque em:

  • Interpretação dos coeficientes e R².
  • Identificação de violações dos pressupostos.
  • Cálculos simples (ex.: previsão de Y dado X).
  • Diferença entre correlação e regressão.