Questão 70 Comentada - Ministério Público do Estado de Santa Catarina (MPE-SC) - Analista de Banco de Dados (2022)

O método Latent Dirichlet Allocation (LDA) é popularmente utilizado para a construção de modelos de tópicos devido a sua flexibilidade e robustez, particularmente em grandes quantidades de texto. Ao mencionar a escolha do LDA em um projeto, um analista foi questionado sobre que aspectos caracterizam a flexibilidade do modelo, especialmente em comparação a um modelo pLSA.
O analista respondeu corretamente:

  • A a capacidade de obter uma distribuição de tópicos para documentos inéditos;
  • B a presença de menos variáveis latentes a ajustar, causando menos overfitting;
  • C a não necessidade de especificar o número de tópicos a serem encontrados;
  • D a ausência de variáveis a priori a serem ajustadas;
  • E a capacidade de modelar texto que não passou por uma etapa de pré-processamento.