CDA Level I 模拟题（2）【附答案解析】

最新推荐文章于 2023-06-08 15:43:17 发布

cndrip

最新推荐文章于 2023-06-08 15:43:17 发布

阅读量1.1k

点赞数 1

分类专栏： CDA Level 文章标签： CDA 模拟题

本文链接：https://blog.csdn.net/cndrip/article/details/125018126

版权

CDA Level 专栏收录该内容

11 篇文章 9 订阅

订阅专栏

练习题【单选题】

1.在SQL语言中对查询结果排序可以使用ORDER BY语句，在ORDER BY子句中如果指定了多个字段，则（）
A.只按第一个字段排序
B.只按最后一个字段排序
C.按从左至右优先依次排序，前一个字段取值相同时，再按照后一个字段排序
D.无法进行排序

2/20
某数据表中包含name字段，现要查找name字段中包含"a"的姓名，下面哪个选项获取的结果最准确（）
A.name LIKE ’%a%’
B.name LIKE ’a%’
C.name LIKE ’%a’
D.name LIKE ’_a%’

3.别名是SQL中常用的内容，通过别名可以区别不同的表、可以让查询结果可读性增强。在SQL语句中，别名不能出现在哪个⼦句中呢（）？
A.SELECT
B.WHERE
C.FROM
D.JOIN

4.使用SQL合并数据简单方便，以下关于SQL中UNION关键字的描述，不正确的是（）？
A.UNION合并数据集的字段个数必须相同
B.UNION合并数据集的字段数据类型必须相同
C.UNION合并数据集的字段顺序必须相同
D.UNION合并后的数据集的行数是合并前的总行数

5.子查询是SQL语句中常用语法，合理的使用子查询可以让代码更简洁。以下关于子查询，说法不正确的是()
A.表子查询必须添加表别名
B.引用表子查询中的计算字段，必须添加列别名
C.所有的连接查询都可以替换为子查询
D.所有的子查询都可以替换为连接查询

6.SQL 中ALL关键字可以实现逻辑运算，它能将单个值与子查询返回的单列值集进行比较，下面关于ALL的含义描述正确的是（）
A.满足所有条件
B.满足任意一个条件
C.一个都不满足
D.满足一个条件

7.SQL提供了丰富的运算符来进行各种运算，我们需要熟悉这些运算符的用法，现要找age字段中大于60岁小于80岁的用户需使用哪个运算符( )
A.加号（+）
B.等号（=）
C.且（AND）
D.或（OR）

9.检验单总体均值的过程中，如果是小样本，但总体标准差已知，检验统计量应该选择（）。
A. $\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}$

B. $\frac{\overline{X}-\mu_0}{S/\sqrt{n}}$

C. $\frac{(n-1)S^2}{\sigma_0^2}$

D. $\frac{(n+1)S^2}{\sigma_0^2}$

10.在假设检验中，有时不仅需要检验正态总体的均值、比例，而且需要检验正态总体的方差。检验单总体方差的过程中，检验统计量服从（）。
A.标准正态分布
B.正态分布
C.卡方分布
D.t 分布

11.某专业毕业的研究生年薪的标准差大约为2000 美元，现在想要估计这个专
业毕业研究生年薪95%的置信区间，并要求误差为100 美元，应抽取多大的样本
量？（）
Zα/2=1.96
A.182
B.98
C.1537
D.634

12.在进行缺失值填补时，若数据呈明显的偏态分布，则可考虑采用下列哪种方
法？（）
A.将存在缺失值的样本删除
B.将存在缺失值的变量删除
C.中位数填补
D.均值填补

13.卡方检验是用途非常广的一种假设检验方法，卡方检验中将任意两行互换则卡方值（）
A.变大
B.变小
C.不变
D.不确定

14.下面的数据是一家企业科研投入与专利产出的相关性描述，根据表格信息，下列选项中正确的是（）。

表中的显著性表示相关系数显著性检验中的P值。

A.专利产出与科研投入高度线性相关
B.专利产出与科研投入相关性不显著
C.专利产出与科研投入存在线性相关性，但是相关性较弱
D.加大科研投入就能够提高专利的产出

15.在分析两变量的关系时常常会使用散点图，现有变量X与Y，如下图所示横轴为X，纵轴为Y，则关于下图描述错误的是（）

A.X 和Y 之间很大可能是非线性关系
B.这些散点中存在异常点
C.X 和Y 之间是正相关的
D.分析两者之间的关系可用逻辑回归模型

16.某数据分析员希望展示某网站10 年来月度访问量数据，采用以下哪个图形比较合适？
A.散点图
B.饼图
C.盒须图
D.折线图

17.以下字段中可作为度量使用的是
A.客户名称
B.产品类别
C.省份
D.购买数量

18.在多个业务表连接构成的多维模型中，如果需要进行跨表筛选应满足___的逻辑
A.维度与主键是父子级关系
B.维度与公共字段是父子级关系
C.维度与度量是父子级关系
D.度量与主键是父子级关系

19.在多个数据表连接构成的多维模型下，星型模式是
A.一个维度表连接多个事实表
B.多个维度表连接多个事实表
C.一个事实表连接多个维度表
D.多个事实表连接多个维度表

20.针对多维数据模型中星座模式表述正确的是
A.一个维度表连接多个事实表
B.多个维度表连接多个事实表
C.一个事实表连接多个维度表
D.多个事实表共用某些维度表

参考答案解析

1.C
order by可以按照从左至右顺序多层级排序，所以答案是C
2.A
’%’可以匹配0个或多个字符，’_’可以匹配一个字符。因此 D选项不如A选项匹配的范围广，比如“huater” 这样的名字通过’%a%‘可以匹配到，但是用’_a%'是匹配不到的。
3.B
在SQL中可以设置表别名和列别名，SQL语句的执⾏顺序是FROM–>–>ON–>JOIN–>WHERE–>GROUP BY-- >HAVING–>SELECT–>ORDER BY，别名是在WHERE⼦句后计算的，所以WHERE⼦句中不能⽤列别名， FROM和JOIN⼦句中可以⽤表别名。
4.D
UNION合并数据集后去重，UNION ALL不去重，所以UNION去除重复值后的行数小于合并前的数据集的总行数。
5.D
当WHERE子句的查询条件是聚合函数时，子查询不能替换为连接查询。
6.A
IN或NOT IN表示是否在其中，等于其中任意一个条件即可,ALL表示每一个，全部条件都满足。
7.C
A. 加号进行数值型数据的加法运算 B. 等号用来做判断，判断值是否相等 C. AND 求两个条件的交集 D.OR求两个条件的并集因此此题应该选C
8.C
floor(x)表示返回小于 x 的最大整数值（去掉小数取整），ceiling(x)表示返回大于 x 的最小整数值（进一取整），round(x,y)表示返回参数 x 的四舍五入的有 y 位小数的值（四舍五入），truncate(x,y)表示返回数字 x 截短为 y 位小数的结果。
9.A
在样本量较小的情况下，如果总体标准差已知，样本统计量服从正态分布，这时可以采用Z统计量。
10.C
Z统计量和t统计量常常用于均值和比例的检验，卡方统计量则用于方差的检验
11.C
计算方法如下：
$n=\frac{(Z_{\alpha/2})^2\sigma^2}{E^2}=\frac{1.96^2\times 2000^2}{100^2}=1536.64$
$[1536.64] = 1537$
方括号[ ]表示取整函数。计算样本量的时候不是四舍五入，而是向上进位。
12.C
中位数不受具体数据分布的影响
13.C
卡方检验的结果与分类变量的顺序无关，将任意两行进行互换，卡方值不变。
14.B
相关性是只有0.03，且其P值很大，所以是不显著的。
15.D
都是数值变量，不能用逻辑回归。
16.D
折线图更容易看出时间上的趋势
17.D
暂无答案解析
18.B
跨表筛选应满足B的条件才能保证按照维度下汇总计算的度量的方式进行计算，所以选B
19.C
C是星型模式的正确定义
20.D
D是星座模式的正确定义