Questão 45 Comentada - Universidade de São Paulo (USP) - Especialista em Laboratório (Especialidade: Inteligência Artificial e Aprendizado de Máquina) - FUVEST (2025)

Uma empresa precisa processar grandes volumes de dados e está avaliando a adoção de Apache Hadoop ou Apache Spark para suas operações. A equipe técnica analisou as características de cada tecnologia e fez as seguintes observações:



• A equipe deseja minimizar a latência no processamento dos dados.


• O projeto exige suporte para análise de dados em tempo real.


• O orçamento disponível permite a utilização de mais memória RAM, se necessário.


• A infraestrutura já possui um Data Lake armazenado no HDFS.



Com base nas informações apresentadas, assinale a alternativa que representa a escolha mais adequada e o seu principal motivo.

  • A O Hadoop é a melhor escolha, pois seu modelo baseado em MapReduce, permite o processamento em memória, reduzindo a latência.
  • B O Hadoop é a melhor escolha, pois é mais eficiente para análises interativas e streaming de dados.
  • C O Spark não pode ser usado nesse cenário, pois exige um sistema de arquivos próprio e não suporta HDFS.
  • D O Spark é a melhor escolha, pois oferece processamento em tempo real por meio do módulo Spark Streaming e pode usar HDFS como fonte de dados.
  • E O Hadoop e o Spark são equivalentes para esse caso, pois ambos possuem processamento em tempo real e baixa latência.