Enunciado
Com a diversificação das aplicações que empregam conjuntos de dados classificados como Big Data, foram desenvolvidos frameworks, heurísticas e metodologias para armazenar, acessar e processá-los sem comprometer o desempenho dos sistemas envolvidos. Duas soluções que se destacam nesse contexto são o Apache Hadoop e o Apache Spark.
A respeito dessas soluções, assinale a afirmativa correta.
Alternativas
- A
O GraphX é um componente do Hadoop permite visualizar e analisar dados com gráficos.
- B
O Apache Spark copia os dados para a RAM antes de processá-los em vez de acessar dados do armazenamento externo.
- C
O Yet Another Resource Negotiator (YARN) é um componente do Spark que aloca recursos para a execução de aplicações.
- D
O Apache Spark não tem bibliotecas de machine learning integradas, enquanto o Apache Spark dispõe da biblioteca de machine learning MLlib.
- E
O Apache Hadoop conta com uma tecnologia especial de processamento de dados chamada Conjunto de Dados Distribuídos Resiliente (RDD).
Gabarito e comentário disponíveis apenas dentro do Mentorito.
Faça login para ver a explicação completa do mentor.