Uma empresa precisa processar grandes volumes de dados e está avaliando a adoção de Apache Hadoop ou Apache Spark para suas operações. A equipe técnica analisou as características de cada tecnologia e fez as seguintes observações:
• A equipe deseja minimizar a latência no processamento dos dados.
• O projeto exige suporte para análise de dados em tempo real.
• O orçamento disponível permite a utilização de mais memória RAM, se necessário.
• A infraestrutura já possui um Data Lake armazenado no HDFS.
Com base nas informações apresentadas, assinale a alternativa que representa a escolha mais adequada e o seu principal motivo.
- A O Hadoop é a melhor escolha, pois seu modelo baseado em MapReduce, permite o processamento em memória, reduzindo a latência.
- B O Hadoop é a melhor escolha, pois é mais eficiente para análises interativas e streaming de dados.
- C O Spark não pode ser usado nesse cenário, pois exige um sistema de arquivos próprio e não suporta HDFS.
- D O Spark é a melhor escolha, pois oferece processamento em tempo real por meio do módulo Spark Streaming e pode usar HDFS como fonte de dados.
- E O Hadoop e o Spark são equivalentes para esse caso, pois ambos possuem processamento em tempo real e baixa latência.