ACP大数据

    本文总结阿里云大数据ACP考试相关试题,仅供参考!如有纰漏,还望指出!

1.在阿里云流计算中,一个用户作业在运行期间随着数据量的突增提升了其作业CPU使用率,这将会影响到其他用户作业的CPU 使用情况( ) B
A.正确 B.错误

2。DataIDE中,调度系统提供一些常用的时间参数,使周期任务自动调度运行时参数会自动替换具体的时间值。其中${bdp.system.cyctime}参数值是取任务运行时的定时时间(年月日时分秒),若按天调度的周期任务配置定时时间为20:00,则2016-01-01当天自动调度时该参数赋值结果是20160101200000.  A
A.正确 B。错误

3.大数据计算服务(MaxCompute,原ODPS) SQL支持子査询,对于子査询的使用描述,以下正确的有_______。(正确答案的数量:3个) ACD
A、子查询可以与另一个子查询或者表进行关联
B、子查询不能作为mapjoin中的小表
C、子查询可以嵌套
D、子查询要有别名

4.通过DMS管理后台或者数据库客户端,连接RDS数据库时,提示错误信息“max_ user_ connections",代表什么含义 ( ) D
A、IOPS超出极限
B、RDS空间满了
C、网络中断
D、RDS数据库的连接数满了

5。阿里云流计算目前可以支持SQL 和MapReduce ( ) B
A、正确
B、错误

6.一个ODPS SQL中最多使用多少个窗口函数? C
A、不限制
B、1
C、5
D、10

7、DatalDE中,调度系统可以根据配置好的任务属性进行自动调度。属性中包含的生效日期是指任务在有效期内可以进行调度运行,任务task1的生效日期为2016-01-01 至2016-06-30, 以下关于任务task1的说法中正确的有( )。 (正确答案的数量: 2个) ( ) AD
A、task1在2016年7月1日当天在调度上无法操作测试
B、task1在2016年4月1日那天操作补数据时无法补业务日期为2016年1月1日的数据
C、task1在2016年6月30日当天就不会再自动调度运行
D、task1如果在2016年1月1日前添加,则2016年1月1日当天才会自动调度运行

8.对于ADS的list分区,哪个说法是正确的 ( ) C
A、list分区可以通过制定最大保留的二级分区数来进行生命周期管理,一旦分区数大于这个值,将会根据导入时间进行排序,将最早导入的分区下线
B、list分区信息定义时可以指定一个现有数据中的列,但是对数据类型有要求
C、list分区为非动态分区,即分区值不由数据本身决定,而是每次导入时用户指定的
D、list分区列的类型目前仅支持数值型和字符串型两种

9、ADS中不同型号的ECU标识着不同的配置。 ABD
A、内存大小
B、磁盘空间
C、带宽
D、Vcpu核数

10、大数据计算服务(MaxCompute, 原ODPS)的安全策略中,提供了项目空间的数据保护机制(ProjectProtection),一旦开启项目空间的数据保护机制, 则无法将项目空间中的数据转移到项目空间之外,所有的数据只能在项目空间内部流动。如果此时有合规的数据流出,可以通过其他的方式实现,包括以下哪三种? (正确答案的数量: 3个)  ABC
A、在设置项目保护(ProjectProtection)的同时,附加一个例外策略(exception),合规的数据流出在该例外策略中定义
B、将两个相关的项目空间设置为互信(TrustedProject),则数据的流向将不会被视为违规
C、通过Package机制分享给其他项目空间,不受ProjectProtection规则的限制
D、将角色Admin授权给某个用户,则该用户访问此项目空间时,不受ProjectProtection规则的限制

11、假如你是某商场的数据分析人员,经理希望通过机器学习算法进行客户细分进行精细化营销,来迎接新年的到来,你拿到数据(历史客户消费记录以及客户的资料信息),准备开始细分工作,下面哪种方法是最有效的细分方法?( )  D
A、直接按客户的自然属性细分
B、按客户的历史消费时间
C、凭借个人经验,制定规则
D、按客户的消费频次、消费额和自然属性细分

12、用户开启SLB健康检查功能后,当后端某个ECS健康检查出现问题时会将请求转发到其他健康检查正常的ECS上,而当该ECS恢复正常运行时,SLB会将其自动恢复到对外或对内的服务中。 B
A、错误
B、正确

13、数据工场DataWorks (原DatalDE )中, SQL任务task1是按天调度的周期性调度任务,每天执行一-次,每次执行生成表table1的一个分区。分区ds值取前一天的日期(格式yyy/mm/dd) ,要使用调度系统提供的时间参数定义table1的分区,使得task 1每次调度运行时自动替换时间值,task1应该( ) 。  A
A、task1需要进行参数配置,引入形变量var=${yyyy/mm/dd-1},同时代码中table1的分区值为ds=${var}
B、task1需要进行参数配置,引入形变量var=${yyyy/mm/dd},同时代码中table1的分区赋值为ds=${var}
C、task1代码中table1的分区ds=${bdp.system.bizdate}
D、taks1代码中table1的分区ds=${bdp.system.cyctime}

14、OTS中可以使用拼接的分片键,拼接就是把几个属性拼接成一个属性。拼接是为了解决什么问题 ( )  C
A、解决数据生命周期的问题
B、解决写压力过于集中的问题
C、解决单个分片键下数据量过大的问题
D、解决OTS预留读写量不足的问题

15、数据工场DataWorks (原DatalDE )中,调度任务每次运行前都先将任务实例化,即生成一个实例, 调度运行时实际上在执行相应的实例,每个实例带有具体的定时时间。对于按天调度的周期性任务task1,以下说法中正确的是 A
A、每天生成1个自动调度实例
B、使用运维中心测试时,会生成一个自动调度的实例
C、使用运维中心补数据时,会生成一个自动调度的实例
D、使用运维中心补数据时,一次补10天的数据,则会生成10个自动调度的实例

16、dataworks本地文本文件上传的限制如下选项是( ) ABC
A、文件类型:仅支持txt和csv
B、文件大小:不超过10M
C、操作对象:导入分区表时,分区不允许为中文
D、没什么限制

17、MaxCompute系统上传下载数据的方式之一Tunnel批量数据通道有哪些 ABCDE
A、大数据开发套件
B、DTS
C、Sqoop
D、Kettle插件
E、MaxCompute客户端

18、关于0DPS中tunnel upload的分隔符,说法正确的是 ABC
A、列分隔符不能包含行分隔符
B、支持多个字符的行列分隔符
C、转义字符分隔符,在命令行方式下只支持\r、\n和\t
D、缺省为空格

19、在RDS只读实例变更配置过程中,并且只读实例的对应源数据库实例状态为"升降级中“主实例可以进行下列哪种任务 ( ) C
A、重启资源
B、内外网切换
C、系统资源监控
D、创建实例

20、大数据计算服务表fact_sale_detail的建表语句如下:createtable fact_ sale_detail(sale_date datetime, region string, amt decimal) partitioned by (dt string);包括dt='20160229', dt='20160301', dt=' 20160302', dt=*'20160303'共四天的数据,每个分区中只包含当天的销售数据。Udf_substr 为自定义的数据(UDF), 功能和substr相同但是性能更好。现在想要统计3月份的按天销售汇总金额,以下哪种方式经过分区剪裁后只需要付3个分区的数据久可以完成计算? (4个) ABCD
A、select dt,sum(amt)from fact_sale_detail where dt like '201603%'group by dt;
B、select dt,sum(amt)from fact_sale_detail where substr(dt,1,6)=201603 group by dt;
C、select dt,sum(amt) from fact_sale_detail where dt in('20160301';'20160302';'20160303')group by dt;
D、select dt,sum(amt) from fact_sale_detail where udf_substr(dt,1,6)='201603'group by dt;
E、select dt,sum(amt)from fact_sale_detail where dt>='20160301' group by dt;

21、OTS 的putrow操作会新插入一行。如果该行内容已经存在,则会报错返回。 ( ) B
A、正确
B、错误

22、加入云盾先知计划的企业可以自主设定奖励计划,奖励额度没有要求。 A
A、正确
B、错误

23、下面关于Tunnel download命令描述正确的是 ABD
A、只支持下载单个文件
B、每一次下载只支持一个表或一个分区
C、同时支持下载多个文件
D、有分区的表一定要制定下载的分区

24、OTS单个分片下所有行的大小总和不能超过多大 ( ) B
A、无限制
B、1G
C、1M
D、1T

25、以下哪一种适合展现当前销售金额和全年KPI相比的完成进度?( ) B
A、雷达图
B、仪表盘
C、饼图
D、极坐标图

26、数据工场DataWorks (原DatalDE)中工作流任务支持一次性调度和周期调度两种类型,对于周期性调度可以设置不同时间粒度的调度周期,以下对任务按月调度的调度周期配置,说法错误的是( )。 ABD
A、无法配置每月1日和15日运行
B、无法配置每月最后一天运行
C、可以配置每月有固定几天需要运行
D、配置每月30日运行,则2月份该任务不会运行

27、大数据计算服务(MaxCompute, 原ODPS )中关于tunnel命令行工具的说法,正确的是? ( 正确答案的数量: 2个) ( ) AC
A、tunnel上传到分区表时,会把数据直接上传到指定的分区中去,不保证业务逻辑
B、tunnel命令上传文件时,不能进行压缩
C、tunnel上传的数据是先写到临时目录,最后确定成功才写到结果目录
D、tunnel上传过程中不加密,数据以明文方式在网络中传输

28、大数据计算服务(MaxCompute, 原ODPS )的运维人员想要知道一张日志表log已经占用了多少存储空间,可以在命令行工具odpscmd中使用__命令查看。 ( ) B
A、ls log
B、desc log
C、select * from log
D、size log

29、如果在非阿里云的服务器安装了安骑士,如何在管理控制台查看报告? A
A、在安装安骑士的过程中需要输入"安装验证key",通过此key关联用户的管理控制台
B、通过阿里云官网账号关联
C、报告无法体验在阿里云的管理控制台
D、非阿里云服务器不支持安骑士

30、数据工场DataWorks (原Data IDE)中数据同步任务可支持不同时间粒度的周期性的数据同步,目前不支持周期粒度为( )的同步。 C
A、小时
B、天
C、实时
D、月

31、某些在线广告APP采用了阿里云的技术,通过对网上搜集的海量数据的分析,给企业主提供精准的广告投放人群。该APP的产品经理介绍该系统能实现以下计数指标:
1-能存储海量数据,单标大小超过100TB
2-支持多张上亿的表进行Join
3-支持多种筛选条件,包括连续范围筛选、取值筛选、and/or/not 条件组合等
4-支持快速 (3秒以内)对十个维度分别进行技术透视分析
根据以上信息,请判断该APP使用的是阿里云的哪款产品 ( ) C
A、DRDS
B、OTS
C、ADS
D、ODPS

32、通过备份文件及日志文件,RDS 可以将实例数据恢复至多少天内的任意时刻 ( ) B
A、5天
B、7天
C、6天
D、3天

33、ODPS的JOIN支持多路间接,但不支持笛卡尔积,即无on条件的链接 ( ) B
A、错误
B、正确

34、关于RDS数据迁移,错误的是 ( ) D
A、ECS上自建的mysql可以导入至RDS
B、用户可以通过mysqldump进行分批导入
C、用在其他IDC的mysql数据库也可以导入至RDS
D、保存在OSS里的图片文件也可以直接导入RDS

35、ODPS 的控制是由那几部分组成?  ABC
A、worker
B、scheduler
C、executor
D、master

36、以下哪个功能,是ODPS的mapreduce不支持的 ( )  D
A、统计信息
B、任务进度会报
C、推测执行
D、文件压缩

37、在数据工场DataWorks (原Data IDE )数据同步任务(云数据库RDS数据同步至(MaxCompute )中,需要根据源表中的时间戳字段实现数据的增量抽取,用户应该配置( ) 选项。 ( )  A
A、数据过滤条件
B、作业速率上限
C、源表切分主键
D、容错记录条数

38、大数据计算服务(MaxCompute,原ODPS)的日志表log是一张分区表,分区键是dt,每天新増的数 据保存在当天的分区中,分区的格式如dt='2016010’, dt='20160102‘...表的生命周期属性设置成了30,以下描述正确的有_____。 (正确答案的数量:2个) AC
A、最后一次修改时间超过30天的分区将会被删除
B、无论数据是否过期,表结构不会被删除
C、当所有数据分区都因生命周期到了被删除后,该表会被自动删除
D、只要表中总的分区数量不超过30个,则旧的分区就不会被删除

39、关于DDos高防IP的功能,描述错误的是? C
A、提供实时精准的流量报表及攻击详情,让你及时准确获取当前服务详情
B、防护多种DDOS类型攻击,包括但不限于一下攻击类型ICMP Flood,UDP Flood,TCP Flood,SYN Flood,ACK Flood等
C、DDOS防护阈值弹性调整,你可以随时升级更高级的防护,调整过程服务中断时间小于等于30秒
D、可随时更换防护IP

40、ODPS中,当一个大表和多个小表做连接时,可以考虑使用mapjoin,以下关于mapjoin的限制,说法正确的是? AB
A、left outer join的左表必须是大表,inner join左表或者右边都可以为大表
B、full outer join不能使用mapjoin
C、最多支持8张小表
D、所有小表占用内存综合不能超过256M

41、ODPS中用户认证(Authentication)的主要功能是检查请求(Request)发送者的真实身份,通过包括以下哪几项验证? ABC
A、正确验证用户状态,包括是否欠费等
B、正确验证接收到的信息在途中是否被篡改
C、正确验证消息发送方的真实身份
D、用户需要提取用户个性化信息时进行用户个性化认证

42、ADS中不支持以下哪些表连接方式。 ACD
A、right join
B、笛卡尔积
C、semi join
D、full join

43、通过阿里云机器学习可以创建实验,在实验中进行模型训练、新记录预测等,这些实验可以离线部署成DataWorks中的任务,通过DataWorks中的调度系统进行定时调度。 A
A、正确
B、错误

44、数据工场DataWorks (原DatalDE) 中,事实表A需要按天增量更新(配置成任务task1),维度表B需要按周更新(配置成任务task2) ,事实表A中的某个字段来自维度表B。关于task1和task2的说法正确的是( )。 A
A、task1设置成按天调度的周期性任务,task2设置成按周调度的周期性任务,配置task1直接依赖task2
B、task1设置成按天调度的周期性任务,task2设置成按周调度的周期性任务,task1不能依赖task2,否则有6天不可以运行
C、task2只能设置成按天调度的周期性任务,然后task1才能依赖task2
D、task2只能设置成按周调度的周期性任务,然后task1才能依赖task2

45、现有的Spark作业可以无缝迁移到流计算 B
A、正确
B、错误

46、在数据工场DataWorks (原Data IDE)数据同步任务中,对于所有的数据源均可以选择源表中的整型列作为切分键,提高该数据同步的效率。 B
A、正确
B、错误

47、大数据计算服务(MaxCompute, 原ODPS )执行MapReduce时,每个Map Worker在读入各自的数据后,需要为每一条数据指定一个Key,这个Key的值决定了记录会被发送到那一个Reduce Worker。单个Reduce Worker有可能接收到多个Key值的记录,一个Key值对应的记录也有可能发送到多个ReduceWork。 ( ) B
A、正确
B、错误

48、ODPS表t1、t2都是分区表,分区键是pt,对于SQL语句select t1.id from t1 left outer join t2 on t1.id=t2.id where t1.pt=*'201 40101' and t2.pt=' 20140101',哪一个说法是正确的? C
A、t2表会进行分区裁剪
B、两张表都会进行分区裁剪
C、t1表会进行分区裁剪
D、两张表都不会进行分区裁剪

49、ODPS中提供了别名命令ALIAS, 可以为哪些对象设置别名 ( ) A
A、资源
B、列
C、行
D、表

50、水果公司的交易系统每天会产生约十亿条交易纪录,这批数据需要同步到公司的大数据计算服务(MaxCompute,原ODPS)的数据仓库中,并且每天通过定时的SQL任务分析生成报表,以下哪种做法是合理的? B
A、创建一个非分区表,每天将新增加数据追加到表中
B、创建一个分区表,每天的增量数据放在当天的分区中
C、创建一个非分区表,每天将新增加数据追加到表中,同时每天创建个视图,该视图仅包含当日数据
D、每天创建一个基于当日数据文件的资源

51、对于ADS的hash分区,哪个说法是正确的 ( ) D
A、ADS表的第一级分区必须为hash分区,第二级没有强制要求,目前可以为list或者hash
B、hash分区是一种动态分区类型,需要指定具体的分区列,最多为2列
C、ADS表的一级hash分区数最大为1000
D、若一张表位batch更新类型,且仅有一级hash分区,则每次导入数据时,会对已有数据进行全量覆盖

52、运营人员需要从大数据计算服务( MaxCompute,原ODPS )的数据仓库中提取几个用户的相关信息,并且提供了用户名称分别为user1,user2,user3,用户数据存放在user表中,用户名称对应的字段是username,则以下哪几个语句可以正确的提取出这批数据? (正确答案的数量: 2个) ( ) AB
A、select * form user where username in('user1','user2','user3')
B、select * from user where username='user1' or username ='user2' or username = 'user2'
C、select * from user where username='user1' and username ='user2' and username ='user3'
D、select * from user where username exists('user1','user2','user3')

53、数据工场DataWorks (原DataIDE )中分区表A的数据是通过按天调度的数据同步任务产生的,表A中的分区字段dt为string类型,填充的是数据产生的日期(格式为"yyyymmdd"), 即任务自动调度日期的前一天,比如2016年4月9日运行调度任务时,那么d的值为"20160408".在配置周期性同步任务时,A表的dt字段需要配置成( ) 才使得任务每次调度运行时自动替换日期。( )  C
A、20160408
B、20160409
C、${bdp.system.bizdate}
D、${bdp.system.cyctime}

54、当RDS实例所占用的磁容量超过了所购买的最大磁盘容量时,RDS实例会被系统锁定。实例被锁定后,用户只有以下哪些权限? CD
A、insert
B、drop table
C、select
D、show view

55、QuickBI中的_____ 是通过菜单形式组织的仪表板的集合,可以制作复杂的带导航菜单的专题类分析。( ) B
A、仪表盘
B、数据门户
C、IFrame
D、工作表

56、数据工场DataWorks (原Data IDE )中的数据同步任务支持将云数据库RDS ( MySQL )中的数据周期性的导入至大数据计算服务( MaxCompute,原ODPS )分区表的具体分区中去。 ( ) A
A、正确
B、错误

57、ODPS SQL的where子句不支持between条件查询 ( ) B
A、错误
B、正确

58、OTS 的单表可以存储规模较大的数据。目前单表存储的限制为( ) C
A、10T
B、100T
C、没有上限
D、1T

59、阿里云流计算可以用于下列哪些应用场景中? ( ) ABCD
A、实时数据仓库
B、实时报表
C、实时监控
D、离线数据仓库

60、MapReduce是一种编程模型,用于大规模数据集的并行运算,它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。它主要包括了__两个最主要的步骤。 ( 正确答案的数量: 2个) AD
A、map
B、combine
C、partition
D、reduce

61、ADS 使用DUMP DATA导出数据时,以限制导出行数为1000为例(LIMIT 1000) ,哪些说法是正确的。 ABD
A、实际数据行数可能小于1000
B、实际数据行数可能等于1000
C、实际数据行数严格等于1000
D、实际数据行数可能稍大于1000

62、可以使用一下ODPS SQL把两个数据集的结果合并在一起: SELECT * FROM sale_ detail WHERE region = 'hangzhou’ UNION ALL SELECT * FROM shanghai',此SQL可以直接作为子查询应用在其他SQL中 ( ) A
A、错误
B、正确

63、为了对数据进行分析,需要把本地的格式化文本数据加载到大数据计算服务 (MaxCompute,原ODPS)中去。可以通过实现。(正确答案的数量: 3个) ABC
A、使用tunnel命令
B、使用数据集成(Data htegration 原云道CDP)
C、使用数据工场DataWorks(原Data IDE)平台加载
D、使用MapReduce完成数据上传

64、在大数据计算服务(MaxCompute, 原ODPS) 的数据仓库中有两张订单表,机票订单at _order 及彩票订单lottery_ order, 两张表的结构相同,都有以下三个字段: order_ id、order_date、 order_amt。机票订单at_order中的数据如下:
order_id order_date order_amt
0001 201 60301 200
0002 201 603011200
彩票订单lottery order 中的数据如下:
order_ id order_date order_amt
0001 201 60301 200
0002 201 60301 10
0003 20160301 2
现在需要把这两张表中的数据合并到- -个订单表中,运行SQL语句:
select * from (
select * from at_ order
union all
select * from lotter_ order
) t1;
对运行结果描述正确的是( ) C
A、结果中有3条记录
B、结果中有4条记录
C、结果中有5条记录
D、结果中有2条记录

65、在执行相应的实例。周期性调度任务每天自动调度的实例都是在当天23:30开始生成的,以下说法正确的是? (3个) ABD
A、任务task1是按天调度的周期性调度任务,2016年4月9日23点00分,把task1的定时时间从原来零点整改成8点30分,4月10日,task1的实例定时时间为8点30分
B、任务task1是任务task2的上游任务,2016年4月9日11点30分,把task2的上游任务换成taks3,当天task2的自动调度实例依赖的还是task1的实例
C、2016年4月9日11点30分新增的按天调度的周期性调度任务,当天可以自动调度运行
D、2016年4月9日11点30分新增的按天调度的周期性调度任务,4月10日可以自动调度运行

66、在dataworks中的发布管理中,只有任务、资源、函数3类对象可以从开发项目被发布到生产项目。 A
A、正确
B、错误

67、大数据计算服务(MaxCompute,原ODPS)的图计算的结果通过哪种方式返回给用户? D
A、输出到大数据计算服务资源中
B、在屏幕上显示
C、输出到本地文件中
D、输出到大数据计算服务的表中

68、云盾先知计划包括以下哪些功能 ( ) ABCD
A、漏洞收集
B、审核漏洞
C、自主设定奖励计划
D、协助漏洞修复

69、ADS 中,同一个表组的表具有以下哪些相同的属性. BC
A、记录条数
B、一级hash分区数
C、副本数
D、二级list分区数

70、RDS for Mysql不支持以下哪种引擎 ( ) B
A、以上都不支持
B、memory
C、innodb
D、myisam

71、数据工场DataWorks (原DatalDE) 中,调度系统提供一些常用时间参数,使周期任务自动调度运行时参数会自动替换具体的时间值。其中${bdp.system.bizdate}参数值是取任务运行时的定时时间所在的年月日(即业务日期),按天调度的周期任务配置定时时间为20:00, 2016-01-01当天自动调度时该参数赋值结果是20160101. B
A、正确
B、错误

72、通过DMS是否可以管理其他阿里云账号下的RDS实例 ( ) B
A、只要有数据库账号即可管理
B、通过DMS"实例授权""功能授权后即可管理"
C、完全不可以
D、通过RAM授权后才能管理

73、关于ODPS policy授权,说法不正确的是。 C
A、支持根据IP授权
B、支持授权的时间段
C、支持根据数据敏感级授权
D、支持表名通配符授权

74、某公司有一个专门的小团队负责线上系统的安全,一年以来使用云盾的DOS高防IP体验很好,成功抵御了5次超过100的攻击,但是费用较高,经过技术团队研究后发现公司的平台并不需要10%的在线率,做到99%即可满足业务要求。CTO决定让小王寻找一个更合适的替代方案,如果用云盾来满足这个需求,哪项服务是最佳的( ) B
A、基础DDOS防护
B、安全网络
C、网络安全专家服务
D、服务器安全托管

75、0DPS 执行某个SQL时返回信息中包括“J3_ 1 _2_ _Stg1", 以下说法中正确的是? D
A、当前Task(ID为3)依赖于ID为1的任务,该task的workercount为2
B、当前Task(ID为3)依赖于id为1的任务,同时触发ID为2的任务
C、当前Task(ID为3)有2个Reducer,1个mapper
D、当前Task(ID为3)依赖于ID为1和ID为2的两个task

76、关于ODPS中的运算符的说法,正确的是 ( ) B
A、String类型可以和其他任意类型进行隐式转换:Boolean不行
B、除boolean外,其他类型不允许参与逻辑运算,也不允许其他类型的隐式类型转换
C、只有bigint、double才能参与算数运算,只有string、bigint、double和decimal才能参与算数运算
D、特殊的关系运算符rlike表示右侧开始匹配

77、针对ODPS SQL做逻辑分析的时候,会进行一些优化,不包括以下哪种优化 ( ) A
A、扫描方式
B、列映射
C、谓语动词下沉
D、常量表达式

78、ADS创建普通表的时候有那些限制? ABC
A、一张普通表至少有一级Hash分区并且分区数不能小于8个
B、一个普通表组最多可以创建256个普通表
C、一个普通表最多不能超过1024列
D、一张普通表至少有一级Hash分区并且分区数不能多于1000个

79、大数据计算服务存储到文件系统上时,使用了________ 的文件格式, 降低了无效的磁盘读取操作。 A
A、列存储
B、文档存储
C、行存储
D、键值对存储

80、关于云盾态势感知的优势,描述错误的是? B
A、免安装,免维护无需安装任何软件,部署任何设备无需复杂配置和更新,省心省力安全管控从未如此简单
B、IT资产划分,软件版本管理基于威胁情报的安全事件管理对入侵行为造成的损失进行评估
C、建设安全体系从黑客角度监控云上业务安全对异常行为进行实时告警让安全"可见、可控、可管"
D、是一个针对阿里云服务器的管家式服务

81、大数据计算服务提供了TunnelSDK,支持高速上传下载数据。实际使用的时候有两种方式,第一种是通过odpscmd客户端,调用封装好的tunnel命令,第二种是直接使用TunnelSDK进行编程,通过调用程序进行个性化的上传下载。目前SDK支持以下哪种语言? A
A、JAVA
B、C++
C、Perl
D、C

82、ADS 的两张维度关联的时候,两个join key可以均不创建hashmap的索引。 B
A、正确
B、错误

83、对于ADS,哪个说法不正确( ) A
A、ADS表存在主键,即可根据主键使用delete删除记录
B、普通表分区列如果是字符串型,则不支持普通表之间的join
C、子查询之间不支持join
D、ADS通过union all 各个分区内的查询结果实现子查询

84、ADS 的表进行实时插入、更新时,遵循哪种一致性设计 ( ) B
A、强一致性
B、最终一致性
C、会话一致性
D、因果一致性

85、DataWorks中工作流任务如果配置为周期性调度,所支持的周期包括哪些?SABCE
A、月调度
B、周调度
C、天调度
D、季度调度
E、小时调度
F、1分钟调度

86、大数据计算服务(MaxCompute,原ODPS )的开发人员需要创建一张用户消费习惯表,其中一个字段想要命名为like,则以下说法正确的是 ( ) D
A、可以将字段命名为like,无需特殊处理
B、可以将字段名命名为like,在创建表及引用该字段时,需要用括起来,即表示like
C、在创建表时,无需特殊处理,但是在引用该字段时需要表示为like
D、无法将字段命名为like,因为这是关键字

87、在MaxCompute中,表中的某一列可以同时作为普通列和分区列。 B
A、正确
B、错误

88、DMS (原ldb Cloud) 是一款访问管理云端数据的WEB服务,覆盖RDS, ADS等阿里云环境,DMS具有以下哪些功能 ACD
A、对象管理
B、数据库创建
C、实例管理
D、数据管理

89、哪个字符集是目前RDS for Mysql不支持的 ( ) B
A、gbk
B、big
C、latin
D、uft8

90、在大数据计算服务( MaxCompute,原ODPS )的insert overwrite语句中, select语句中的数据会通过列名自动匹配到目标表中的列名,因此select语句中的列的顺序不影响结果。 B
A、正确
B、错误

91、授权的两个方法是:ACL基于对象的授权和Policy基于策略的授权。 A
A、正确
B、错误

92、大数据计算服务( MaxCompuTe,原ODPS )允许用户在MapReduce中通过读取资源的方式使用表数据。 A
A、正确
B、错误

93、DataWorks中,工作流任务支持的调度类型包括: AB
A、一次性调度
B、周期调度
C、混合类型调度
D、需要第三方工具用于支持调度

94、大数据计算服务(MaxCompute, 原ODPS ) 的insert overwrite操作中,select 中的表达式类型与对应的目标中的数据类型必须一致,否则会导致异常。( ) B
A、正确
B、错误

95、MaxCompute Graph是MaxCompute提供的编程框架之一,主要是用来进行图像处理 ( ) B
A、正确
B、错误

96、反欺诈服务可支持WEB和移动平台。
前端接入,不同的平台,方式不一样:
·Web 平台、移动平台HTML5应用,前端页面引入JS脚本。
·移动平台Native应用,引入SDK。
ODPS中,客户端提交任务成功后,可以根据___ 来查询作业状态 A
A、Instance ID
B、Task ID
C、SQL ID
D、JOB ID

97、dataworks运维管理中的终止运行只可等待运行、运行中状态的实例进行终止运行操作,操作后,该实例将为失败状态。 A
A、正确
B、错误

98、MaxCompute目前支持的分区类型包括:( ) ABCD
A、string
B、tinyint
C、bigint
D、varchar

99、传统的MapReduce模型要求每一轮MapReduce操作之后,数据必须落地到分布式文件系统上。而一般的MapReduce应用通常由多个MapReduce作业组成,每个作业结束之后需要写入磁盘,接下去的Map任务很多情况下只是读一遍数据,为后续的Shuffle阶段做准备,这样其实造成了冗余的I0操作。为了解决这一问题,提供更优的性能,大数据计算服务提供了扩展的MapReduce模型,该模型区别于普通MapReduce模型的主要特点是? A
A、支持Map后连接任意多个Reduce操作,如Map-reduce-reduce
B、支持map后不连接reduce,而是连接另一个map,如map-map-reduce
C、支持chain mapper/reducer,即支持map-reduce-map-reduce
D、支持没有map,直接进入reduce

100、以下哪项不是ODPS MR的必须组成阶段 ( ) D
A、Map
B、Shuffle
C、Reduce
D、Combiner

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值