对于Hive中分区的概念,下列描述错误的是()。
A.分区字段只能有一个
B.分区字段要在创建表时定义
C.使用分区可以提高查询效率
D.一个表可以在多个维度上进行分区
A.分区字段只能有一个
B.分区字段要在创建表时定义
C.使用分区可以提高查询效率
D.一个表可以在多个维度上进行分区
第2题
A.分区表示将大表中的数据分成称为分区的许多小的子集
B.基于时间的查询分区剪枝可以大大提高查询性能
C.分区表数据由于分了很多区,以至于在管理方面带来很多不方便
D.业务表一般按照时间或地区做Range分区
第3题
A.冷数据一般而言指的是百TB级别或以上、不更新、偶尔访问的数据,如大量历史详单数据
B.通常近期业务访问的HDFS数据目录、Hive表的近期分区目录以及HBase活动表目录下最可能是热数据
C.通常HDFS上的归档业务数据、Hive历史表/历史分区数据、HBase历史表数据最可能是冷数据
D.实时数据,通常是实时上报到Hive或写入MySQL且不需要实时访问或处理的业务数据
第5题
A.Hive最终将数据存储在HDFS中
B.Hive是Hadoop平台的数据仓库工具
C.HQL可以通过MapReduce执行任务
D.Hive对HBase有强依赖
第7题
A.表组的属性可以修改,修改后马上生效
B.对于批量插入的表可以建立二级list分区,二级list分区是非动态分区,分区值由用户导入时指定
C.minredundancy是表组的一个属性,可以指定不同的值没,比如1、2、3、4等,缺省值为2
D.表组是一个逻辑概念,同一个表组中的表可以选择同时上线,再删除表组时,会把表组中的表一起删除
第8题
A.在使用多路插入时,可对同一张表同时执行insertinto和insertoverwrite
B.使用动态分区插入时,动态分区列必须在select列表中
C.MaxcomputeSQL支持between子句
D.对于分区表,可指定某个分区的lifecycle,其中n为正整数,单位为天
第10题
A.切换Leader主各节点
B.启动Loader实例
C.配置Leader参数
D.查看Loader服务状态