Questão FGV · TCE PI · 2025 — mentorito

FGVTCE PI2025TI - Ciência de Dados e Inteligência ArtificialEcossistema Hadoop

Enunciado

Com a diversificação das aplicações que empregam conjuntos de dados classificados como Big Data, foram desenvolvidos frameworks, heurísticas e metodologias para armazenar, acessar e processá-los sem comprometer o desempenho dos sistemas envolvidos. Duas soluções que se destacam nesse contexto são o Apache Hadoop e o Apache Spark.

A respeito dessas soluções, assinale a afirmativa correta.

Alternativas

A
O GraphX é um componente do Hadoop permite visualizar e analisar dados com gráficos.
B
O Apache Spark copia os dados para a RAM antes de processá-los em vez de acessar dados do armazenamento externo.
C
O Yet Another Resource Negotiator (YARN) é um componente do Spark que aloca recursos para a execução de aplicações.
D
O Apache Spark não tem bibliotecas de machine learning integradas, enquanto o Apache Spark dispõe da biblioteca de machine learning MLlib.
E
O Apache Hadoop conta com uma tecnologia especial de processamento de dados chamada Conjunto de Dados Distribuídos Resiliente (RDD).

Gabarito e comentário disponíveis apenas dentro do Mentorito.

Responder no Mentorito ← Voltar ao acervo

Faça login para ver a explicação completa do mentor.

Questões relacionadas