Um modelo de regressão linear múltipla foi desenvolvido para prever o tempo de tramitação de processos judiciais (em dias), com base na quantidade de páginas do processo e no número de partes envolvidas. Durante a análise de resíduos do modelo, o analista decide calcular a distância de Cook para identificar possíveis observações influentes. Nesse contexto, assinale a afirmativa correta.
- A A remoção de observações com alta distância de Cook sempre melhora a precisão do modelo de regressão linear.
- B A distância de Cook é usada apenas para identificar outliers e não considera a influência das observações nas estimativas dos coeficientes do modelo.
- C Uma observação com valor elevado para a distância de Cook pode ser considerada influente, sugerindo que sua remoção pode causar uma mudança nos coeficientes do modelo.
- D Qualquer processo que possua um número elevado tanto de páginas quanto de partes envolvidas terá um valor elevado de distância de Cook, devendo ser removida para melhorar o ajuste do modelo.
- E A remoção de observações com distância de Cook elevada deve ser realizada de forma imediata e deliberada, sem realizar uma análise mais aprofundada da sua origem ou representatividade no contexto dos dados