O método Latent Dirichlet Allocation (LDA) é popularmente utilizado para a construção de modelos de tópicos devido a sua flexibilidade e robustez, particularmente em grandes quantidades de texto. Ao mencionar a escolha do LDA em um projeto, um analista foi questionado sobre que aspectos caracterizam a flexibilidade do modelo, especialmente em comparação a um modelo pLSA.
O analista respondeu corretamente:
- A a capacidade de obter uma distribuição de tópicos para documentos inéditos;
- B a presença de menos variáveis latentes a ajustar, causando menos overfitting;
- C a não necessidade de especificar o número de tópicos a serem encontrados;
- D a ausência de variáveis a priori a serem ajustadas;
- E a capacidade de modelar texto que não passou por uma etapa de pré-processamento.