Questões de Análise Multivariada (Estatística)

Limpar Busca
A respeito da análise de conglomerados, analise as afirmativas a seguir.
I. Na execução do algoritmo K-means, é possível que a alocação de observações aos clusters não mude entre duas iterações sucessivas.
II. O uso de duas medidas de similaridade distintas pode produzir dois dendrogramas diferentes ao se aplicar um algoritmo de agrupamento aglomerativo para o mesmo conjunto de dados.
III. Em uma análise envolvendo duas variáveis, considere que, após a primeira iteração do algoritmo K-Means aplicado para agrupar sete observações em três clusters, C1, C2 e C3, obteve-se a seguinte configuração: C1={(2,2), (4,4), (6,6)}; C2={(0,4), (4,0)} e C3={(5,5), (9,9)}. Então, os respectivos centroides que darão seguimento à próxima iteração serão C1=(4,4), C2=(2,2) e C3=(7,7).
Está correto o que se afirma em
  • A I, II e III.
  • B I e II, apenas.
  • C I e III, apenas.
  • D II e III, apenas.
Considere a realização de uma pesquisa exploratória para estudar o comportamento de indivíduos em relação ao hábito de se socializarem. Vinte e uma pessoas responderam a um conjunto de sete variáveis relacionadas ao tema. A escala de medida foi de 1 a 5, onde 1 representava a discordância total e 5 representava concordância total quanto à afirmação expressa na variável. Foi realizada uma análise fatorial ortogonal com extração das cargas fatoriais pelo método de componentes principais baseado na matriz de correlação das sete variáveis disponíveis.

Imagem relacionada à questão do Questões Estratégicas


De acordo com os resultados parciais fornecidos na tabela, assinale a afirmativa correta.
  • A Os três fatores apresentados atendem ao critério de Kaiser.
  • B A variável 4 apresenta maior correlação com o fator 1 do que com os demais fatores.
  • C Os dois últimos fatores, associados à análise realizada, explicam 45,1% da variabilidade total das variáveis envolvidas no problema.
  • D Os três fatores apresentados explicam melhor a variabilidade da variável 2 do que das demais variáveis, considerando suas versões padronizadas.

A análise de componentes principais é utilizada para

  • A ajustar um modelo de regressão linear.
  • B reduzir o número de variáveis a serem avaliadas.
  • C calcular a probabilidade de sucesso de uma variável.
  • D categorizar as variáveis para então ajustar um modelo.

A Análise de Componentes Principais (PCA) é uma técnica de transformação de dados que tem como objetivo encontrar as direções de maior variação nos dados, geralmente representadas pelos chamados componentes principais, e gerar novas representações dos dados.
Assinale o objetivo principal dessa técnica. 

  • A Discretização dos dados.
  • B Redução da dimensionalidade dos dados.
  • C Normalização dos dados.
  • D Padronização dos dados.
  • E Cálculo de distâncias entre os dados.
Após a extração dos fatores em uma análise fatorial, pode ser calculado o grau de adaptação das variáveis aos fatores por meio das cargas fatoriais. Normalmente, o que acontece é que a maior parte das variáveis tem cargas altas no fator mais importante e cargas baixas nos outros fatores, tornando a interpretação mais difícil. Nesse sentido, a técnica de rotação de fatores é utilizada para atingir uma melhor distinção entre os fatores. Nesse contexto, analise as afirmativas a seguir.
I. A rotação quartimax visa maximizar a dispersão da carga dos fatores de uma variável por todos os fatores, geralmente acarretando em muitas variáveis com cargas altas em um único fator.
II. A rotação varimax facilita a interpretação das cargas fatoriais.
III. A rotação promax é um método rápido desenvolvido para bancos de dados muito grandes.
É correto o que se afirma em
  • A I, II e III.
  • B II, apenas.
  • C I e II, apenas.
  • D I e III, apenas.
  • E II e III, apenas.