Questões de Análise Multivariada (Estatística)

Limpar Busca

Uma equipe do Ministério Alfa conduz um projeto baseado em Big Data para entender o perfil de acesso da população a atividades financiadas com recursos federais. A base integra milhões de registros oriundos de plataformas digitais de ingressos, editais culturais, visitas a museus federais e interações nas redes sociais de equipamentos culturais.
Como a pesquisa ainda não tem uma variável-alvo definida, o objetivo inicial é identificar grupos latentes de usuários com padrões semelhantes de comportamento, considerando variáveis como frequência de participação, região e faixa etária. Após essa etapa, a equipe pretende avaliar os fatores que contribuem para o engajamento cultural em regiões com baixa participação e, por fim, recomendar estratégias de ampliação de acesso.
Considerando os modelos multivariados, a natureza da base de dados e os objetivos e etapas propostos para a pesquisa, a equipe responsável deveria:

  • A começar com análise de séries temporais desagregadas por faixa etária e, a partir delas, gerar agrupamentos por similaridade de comportamento;
  • B aplicar análise prescritiva com base em redes neurais profundas desde o início, pois a ausência de variável-alvo impede o uso de aprendizado supervisionado;
  • C iniciar com clusterização por k-médias, caracterizar os grupos com análise descritiva e, então, empregar regressão preditiva para estimar o impacto de intervenções;
  • D utilizar agrupamento hierárquico para redução de dimensionalidade, seguido de técnicas de análise discriminante para prever padrões de engajamento futuro;
  • E aplicar regressão logística sobre variáveis de participação por região e perfil, seguida de análise de variância, para testar diferenças estatísticas significativas entre os grupos.

Uma pesquisa com estudantes e funcionários de uma universidade coletou as seguintes variáveis:

•  Categóricas: faixa etária (≤ 30, 31–50, > 50 anos), gênero (masculino/feminino), diagnóstico de hipertensão (sim/não);
•  Numéricas: horas semanais de atividade física, média de pressão arterial.

Considerando a técnica estatística mais adequada para cada objetivo específico da análise, é correto afirmar que se deve usar

  • A regressão simples para avaliar a associação entre faixa etária e gênero com o diagnóstico de hipertensão, todas variáveis categóricas.
  • B análise de correspondência para examinar a relação entre horas semanais de exercício físico e pressão arterial, ambas variáveis numéricas.
  • C análise de correspondência múltipla para explorar simultaneamente as associações entre faixa etária, gênero e presença de hipertensão, todas variáveis categóricas.
  • D análise de correspondência múltipla para investigar a associação entre o gênero dos participantes (categórica) e os seus níveis de pressão arterial (numérica).
  • E análise de correspondência simples para prever os níveis de pressão arterial com base na faixa etária (categórica) e nas horas semanais de exercício (numérica).

A correlação entre y1 e F1 é igual a:

  • A 0,25
  • B 0,33
  • C 0,50
  • D 0,67
  • E 0,75

O percentual da variação de y1 explicado pelo primeiro fator é igual a:

  • A 25%
  • B 50%
  • C 75%
  • D 90%
  • E 100%

Considere o seguinte exemplo: Um pesquisador agrônomo pretende agrupar propriedades rurais com características semelhantes de uso de fertilizantes. A técnica estatística multivariada mais adequada para essa finalidade é:

  • A Regressão linear simples.
  • B Análise discriminante.
  • C Correlação de Pearson.
  • D Clustering.