题目
A.FSDataInputStream扩展了DataInputStream以支持随机读
B.为实现细粒度并行,输入分片(Input Split)应该越小越好
C.一台机器可能被指派从输入文件的任意位置开始处理一个分片
D.输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割
第2题
A.FSDataInputStream扩展了DataInputStream以支持随机读
B.为实现细粒度并行,输入分片(Input Split)应该越小越好
C.一台机器可能被指派从输入文件的任意位置开始处理一个分片
D.输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割
第6题
A.FSDataInputStream扩展了DataInputStream以支持随机读
B.为实现细粒度并行,输入分片(Input Split)应该越小越好
C.一台机器可能被指派从输入文件的任意位置开始处理一个分片
D.输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割
第7题
A.FSDataInputStream扩展了DataInputStream以支持随机读
B.为实现细粒度并行,输入分片应该越小越好
C.一台机器可能被指派从输入文件的任意位置开始处理一个分片
D.输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割
第8题
B.为实现细粒度并行,输入分片(InputSplit)应该越小越好
C.一台机器可能被指派从输入文件的任意位置开始处理一个分片
D.输入分片是一种记录的逻辑划分,而数据块是对输入数据的物理分割
第9题
B.大规模并行计算:在分布式并行环境中将一个任务分解成更多份细粒度的子任务,这些子任务在空闲的处理节点之间被调度和快速处理之后,最终通过特定的规则进行合并生成最终的结果。典型技术为MapReduce
C.结构化分布式数据存储:类似文件系统采用数据库来存储结构化数据,云计算也需要采用特殊技术实现结构化数据存储,典型技术为BigTable/Dynamo等
D.分布式文件系统:可扩展的支持海量数据的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。它运行于廉价的普通硬件上,提供容错功能(通常保留数据的3份拷贝),典型技术为GFS/HDFS/KFS等
第10题
A.实时分析一般应用于电子商务和金融。需要在数据不断变化的情况下,进行快速的数据分析,并以非常短的延迟返回,才能达到不影响用户体验的目的
B.实时分析采用的架构包括,使用传统关系数据库的并行处理集群,或者采用实时计算架构,例如开源数据分析平台Storm
C.离线分析通常指分析时不需要联网的应用,例如机器学习,统计分析和推荐算法
D.离线分析的技术框架相对成熟,常用的分析框架是:HDFS做存储,MapReduce做计算框架,Hive作为数据仓库
第11题
A.HDFS实现了对分布式存储的底层支持,可高速读写数据
B.HDFS可根据需求进行水平扩展
C.HDFS在MapReduce任务处理过程中提供了目录的访问和存储的支持
D.HDFS与MapReduce相互协作共同完成hadoop分布式集群主要任务
为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!