关于Hive与Hadoop其他组件的关系,以下描述错误的是:()。
A.SparkStreaming与Flink相比,时延更低
B.Flink流式处理引擎能够同时提供支持流处理和批处理应用的功能
C.checkpoint实现了Flink的容错
D.与FusionInghtHD中的Streaming相比,Flink具有更高的吞吐量
A.SparkStreaming与Flink相比,时延更低
B.Flink流式处理引擎能够同时提供支持流处理和批处理应用的功能
C.checkpoint实现了Flink的容错
D.与FusionInghtHD中的Streaming相比,Flink具有更高的吞吐量
第1题
A.Hive最终将数据存储在HDFS中
B.Hive是Hadoop平台的数据仓库工具
C.HQL可以通过MapReduce执行任务
D.Hive对HBase有强依赖
第3题
A.sqoop可以将HQL/SQL的执行结果导入到Oracle或者Hive
B.不能大于1M
C.sqoop使用参数-m(即--num-mappers)进行导数时,分布在每一个map上的数据是均匀的
D.sqoop将数据导入Oracle时遇到值的长度超长,sqoop会继续将正常的数据导入Oracle
第4题
A.能基于Atlas的Web页面查询用户的数据查询操作历史
B.能基于Atlas的Web页面浏览数据的血缘关系
C.能基于Atlas的Web页面标注元数据,为元数据分类
D.Atlas支持与Hive数据源的集成,可以实时获取Hive的元数据变化
第5题
A、Hive最佳使用场景是大数据集的批处理作业
B、Hive可以实现在大规模集群上实现低延迟快速查询
C、Hive构建在基于静态批量处理的Hadoop之上,Hadoop通常有较高的延迟并且在提交作业和调度的时候需要大量的开销
D、Hive查询操作过程严格遵循HadoopMap Reduce的作用执行模型,Hive将用户的HiveSQL语句通过解释器转换为Map ReduceHadoop集群上
第6题
A.Kafka作为高并发实时接入缓存,解决接入量的问题
B.Flink作为实时计算引擎实时消费Kafka数据写入HBase
C.HBase数据库为海量实时接入数据提供存储与实时查询能力
D.Hive为海量历史数据提供实时分析能力
第10题
A.exportHADOOP_HOME=hadoop-install-dir
B.exportHIVE_HOME=hive-install-dir
C.exportJAVA_HOME=java-install-dir
D.exportHDFS_HOME=hdfs-install-dir