CDA Level I 模拟题(2)【附答案解析】

练习题 【单选题】

1.在SQL语言中对查询结果排序可以使用ORDER BY语句,在ORDER BY子句中如果指定了多个字段,则()
A.只按第一个字段排序
B.只按最后一个字段排序
C.按从左至右优先依次排序,前一个字段取值相同时,再按照后一个字段排序
D.无法进行排序

2/20
某数据表中包含name字段,现要查找name字段中包含"a"的姓名,下面哪个选项获取的结果最准确()
A.name LIKE ’%a%’
B.name LIKE ’a%’
C.name LIKE ’%a’
D.name LIKE ’_a%’

3.别名是SQL中常用的内容,通过别名可以区别不同的表、可以让查询结果可读性增强。在SQL语句中,别名不能出现在哪个⼦句中呢()?
A.SELECT
B.WHERE
C.FROM
D.JOIN

4.使用SQL合并数据简单方便,以下关于SQL中UNION关键字的描述,不正确的是()?
A.UNION合并数据集的字段个数必须相同
B.UNION合并数据集的字段数据类型必须相同
C.UNION合并数据集的字段顺序必须相同
D.UNION合并后的数据集的行数是合并前的总行数

5.子查询是SQL语句中常用语法,合理的使用子查询可以让代码更简洁。以下关于子查询,说法不正确的是()
A.表子查询必须添加表别名
B.引用表子查询中的计算字段,必须添加列别名
C.所有的连接查询都可以替换为子查询
D.所有的子查询都可以替换为连接查询

6.SQL 中ALL关键字可以实现逻辑运算,它能将单个值与子查询返回的单列值集进行比较 ,下面关于ALL的含义描述正确的是()
A.满足所有条件
B.满足任意一个条件
C.一个都不满足
D.满足一个条件

7.SQL提供了丰富的运算符来进行各种运算,我们需要熟悉这些运算符的用法,现要找age字段中大于60岁小于80岁的用户需使用哪个运算符( )
A.加号(+)
B.等号(=)
C.且(AND)
D.或(OR)

9.检验单总体均值的过程中,如果是小样本,但总体标准差已知,检验统计量应该选择()。
A. X ‾ − μ 0 σ / n \frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} σ/n Xμ0

B. X ‾ − μ 0 S / n \frac{\overline{X}-\mu_0}{S/\sqrt{n}} S/n Xμ0

C. ( n − 1 ) S 2 σ 0 2 \frac{(n-1)S^2}{\sigma_0^2} σ02(n1)S2

D. ( n + 1 ) S 2 σ 0 2 \frac{(n+1)S^2}{\sigma_0^2} σ02(n+1)S2

10.在假设检验中,有时不仅需要检验正态总体的均值、比例,而且需要检验正态总体的方差。检验单总体方差的过程中,检验统计量服从( )。
A.标准正态分布
B.正态分布
C.卡方分布
D.t 分布

11.某专业毕业的研究生年薪的标准差大约为2000 美元,现在想要估计这个专
业毕业研究生年薪95%的置信区间,并要求误差为100 美元,应抽取多大的样本
量?( )
Zα/2=1.96
A.182
B.98
C.1537
D.634

12.在进行缺失值填补时,若数据呈明显的偏态分布,则可考虑采用下列哪种方
法?( )
A.将存在缺失值的样本删除
B.将存在缺失值的变量删除
C.中位数填补
D.均值填补

13.卡方检验是用途非常广的一种假设检验方法,卡方检验中将任意两行互换则卡方值( )
A.变大
B.变小
C.不变
D.不确定

14.下面的数据是一家企业科研投入与专利产出的相关性描述,根据表格信息,下列选项中正确的是( )。

表中的显著性表示相关系数显著性检验中的P值。

A.专利产出与科研投入高度线性相关
B.专利产出与科研投入相关性不显著
C.专利产出与科研投入存在线性相关性,但是相关性较弱
D.加大科研投入就能够提高专利的产出

15.在分析两变量的关系时常常会使用散点图,现有变量X与Y,如下图所示横轴为X,纵轴为Y,则关于下图描述错误的是( )

A.X 和Y 之间很大可能是非线性关系
B.这些散点中存在异常点
C.X 和Y 之间是正相关的
D.分析两者之间的关系可用逻辑回归模型

16.某数据分析员希望展示某网站10 年来月度访问量数据,采用以下哪个图形比较合适?
A.散点图
B.饼图
C.盒须图
D.折线图

17.以下字段中可作为度量使用的是
A.客户名称
B.产品类别
C.省份
D.购买数量

18.在多个业务表连接构成的多维模型中,如果需要进行跨表筛选应满足___的逻辑
A.维度与主键是父子级关系
B.维度与公共字段是父子级关系
C.维度与度量是父子级关系
D.度量与主键是父子级关系

19.在多个数据表连接构成的多维模型下,星型模式是
A.一个维度表连接多个事实表
B.多个维度表连接多个事实表
C.一个事实表连接多个维度表
D.多个事实表连接多个维度表

20.针对多维数据模型中星座模式表述正确的是
A.一个维度表连接多个事实表
B.多个维度表连接多个事实表
C.一个事实表连接多个维度表
D.多个事实表共用某些维度表


参考答案解析

1.C
order by可以按照从左至右顺序多层级排序,所以答案是C
2.A
’%’可以匹配0个或多个字符,’_’可以匹配一个字符。因此 D选项不如A选项匹配的范围广,比如“huater” 这样的名字 通过’%a%‘可以匹配到,但是用’_a%'是匹配不到的。
3.B
在SQL中可以设置表别名和列别名,SQL语句的执⾏顺序是FROM–>–>ON–>JOIN–>WHERE–>GROUP BY-- >HAVING–>SELECT–>ORDER BY,别名是在WHERE⼦句后计算的,所以WHERE⼦句中不能⽤列别名, FROM和JOIN⼦句中可以⽤表别名。
4.D
UNION合并数据集后去重,UNION ALL不去重,所以UNION去除重复值后的行数小于合并前的数据集的总行数。
5.D
当WHERE子句的查询条件是聚合函数时,子查询不能替换为连接查询。
6.A
IN或NOT IN表示是否在其中,等于其中任意一个条件即可,ALL表示每一个,全部条件都满足。
7.C
A. 加号进行数值型数据的加法运算 B. 等号用来做判断,判断值是否相等 C. AND 求两个条件的交集 D.OR求两个条件的并集 因此此题应该选C
8.C
floor(x)表示返回小于 x 的最大整数值(去掉小数取整),ceiling(x)表示返 回大于 x 的最小整数值(进一取整),round(x,y)表示返回参数 x 的四舍五入的 有 y 位小数的值(四舍五入),truncate(x,y)表示返回数字 x 截短为 y 位小数的 结果。
9.A
在样本量较小的情况下,如果总体标准差已知,样本统计量服从正态分布,这时可以采用Z统计量。
10.C
Z统计量和t统计量常常用于均值和比例的检验,卡方统计量则用于方差的检验
11.C
计算方法如下:
n = ( Z α / 2 ) 2 σ 2 E 2 = 1.9 6 2 × 200 0 2 10 0 2 = 1536.64 n=\frac{(Z_{\alpha/2})^2\sigma^2}{E^2}=\frac{1.96^2\times 2000^2}{100^2}=1536.64 n=E2(Zα/2)2σ2=10021.962×20002=1536.64
[ 1536.64 ] = 1537 [1536.64]=1537 [1536.64]=1537
方括号[ ]表示取整函数。计算样本量的时候不是四舍五入,而是向上进位。
12.C
中位数不受具体数据分布的影响
13.C
卡方检验的结果与分类变量的顺序无关,将任意两行进行互换,卡方值不变。
14.B
相关性是只有0.03,且其P值很大,所以是不显著的。
15.D
都是数值变量,不能用逻辑回归。
16.D
折线图更容易看出时间上的趋势
17.D
暂无答案解析
18.B
跨表筛选应满足B的条件才能保证按照维度下汇总计算的度量的方式进行计算,所以选B
19.C
C是星型模式的正确定义
20.D
D是星座模式的正确定义

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值