数据分析练习题1
在线试卷链接:
CDA认证考试 Level Ⅰ业务数据分析师模拟题 - CDA人工智能学院 - 数据科学与人工智能从业者的在线大学_AIU人工智能学院_经管之家_CDA数据分析师旗下edu.cda.cn![058de16ae3bf5c668ae5613fa1f244f7.png](https://i-blog.csdnimg.cn/blog_migrate/b46c1e1624ec883610ec0a7ec81262ca.jpeg)
一、单选题
1.统计图中的散点图主要用来( A )。
A.观察变量之间的相关关系 B.主要用来表示总体各部分所占的比例
C.主要用来表示次数分布 D.主要用来反映分类数据的频数分布
2.抽样误差是指( D )
A.在调查过程中由于观察、测量等差错所引起的误差
B.人为原因所造成的误差
C.在调查中违反随机原则出现的系统误差
D.随机抽样而产生的代表性误差
3.检查异常值常用的统计图形:( B )
A、条形图
B、箱体图
C、帕累托图
D、线图
4.线性回归里的残差分析不可能用于诊断( D )
A、残差独立性
B、变量分布
C、异常值侦察
D、最大迭代次数
5.拟合logistic回归模型时有两个分类变量,分别是Gender(水平为female和male),Class(水平为1 、2和3),下表为输出结果,下面哪个选项的说法是正确的?(C)
![2ef95b9df6b81bf7ff200a6f1266bdf5.png](https://i-blog.csdnimg.cn/blog_migrate/9c241045e0a1fd20d2d41cfffdbe8f59.png)
A.变量Gender和Class采用效应编码
B.变量Gender采用引用编码,引用水平为female
C.变量Class采用引用编码,引用水平为3
D.变量Gender和Class采用全量编码
6.因子分析的主要作用:( A )
A、对变量进行降维
B、对变量进行判别
C、对变量进行聚类
D、以上都不对
7.关于K-means 聚类过程正确的是:( A )
A、使用的是迭代的方法
B、均适用于对变量和个案的聚类
C、对变量进行聚类
D、以上都不对
8.东北人养了一只鸡和一头猪。一天鸡问猪:"主人呢?"猪说:"出去买蘑菇了。"鸡听了撒丫子就跑。猪说:"你跑什么?"鸡叫道:“有本事主人买粉条的时候你小子别跑!"
以上对话体现了数据分析方法中的( A )
A. 关联 B. 聚类 C. 分类 D. 自然语言处理
9.已知甲班学生“统计学”的平均成绩为86分,标准差是12.8分,乙班学生“统计学”的平均成绩是90分,标准差是10.3分,下列表述正确的是( A )
A. 乙班平均成绩的代表性高于甲班
B. 甲班平均成绩的代表性高于乙班
C. 甲、乙两班平均成绩的代表性相同
D. 甲、乙两班平均成绩的代表性无法比较
10.根据样本资料估计得出人均消费支出Y对人均收入X的回归模型
![8a83642badd99638797351bb30b2b8df.png](https://i-blog.csdnimg.cn/blog_migrate/37050493dcb3150c42c27a3839360c91.png)
,表明人均收入每增加1%,人均消费支出将增加( B )
A. 0.2% B. 0.75% C. 2% D. 7.5%
11.某企业根据对顾客随机抽样的信息得到对该企业产品表示满意的顾客比率的95%置信度的置信区间是(56%,64%)。下列正确的表述是( A )
A.总体比率的95%置信度的置信区间为(56%,64%)
B.总体真实比率有95%的可能落在(56%,64%)中
C.区间(56%,64%)有95%的概率包含了总体真实比率
D.由100次抽样构造的100个置信区间中,约有95个覆盖了总体真实比率
12.以下哪个语句可以将字符型数值date(示例:“2001-02-19”)转换为数值类型? ( A )
A、INPUT(date,YYMMDD10.)
B、PUT(date,YYMMDD10)
C、INPUT(date,YYMMDD10.)
D、PUT(date,YYMMDD10)
13.
![dcc0ee8425a3070e02b2e2be336467d4.png](https://i-blog.csdnimg.cn/blog_migrate/e4103ccf7e5fddb3329a44d4b1a62d7e.png)
,取值范围在[0,1],反映回归曲线的拟合优度,当
![7f302504dfe0d88a3925a5b32df631f2.png](https://i-blog.csdnimg.cn/blog_migrate/91d6fdade1c1ffa4f82fdbdfcf83652f.png)
趋近于0,则回归曲线拟合优度( B )
A.越好 B. 越差 C. 适中 D. 以上都不对
14.分析购买不同产品的频次时,使用以下哪个任务? ( D )
A、列表数据
B、汇总表
C、汇总统计量
D、单因子频数
15.当你用跑步时间(RunTime)、年龄(Age)、跑步时脉搏(Run_Pulse)以及最高脉搏(Maximum_Pulse)作为预测变量来对耗氧量(Oxygen_Consumption )进行回归时,年龄(Age)的参数估计是-2.78. 这意味着什么?( B )
A、年龄每增加一岁,耗氧量就增大2.78.
B、年龄每增加一岁,耗氧量就降低2.78.
C、年龄每增加2.78岁,耗氧量就翻倍。
D、年龄每减少2.78岁,耗氧量就翻倍。
16.ROC曲线凸向哪个角,代表模型约理想?( A )
A、左上角
B、左下角
C、右上角
D、右下角
17.在所有两位数(10-99)中任取一两位数,则此数能被2或3整除的概率为 ( B )
A. 6/5 B. 2/3 C. 83/100 D.均不对
18.对事件A和B,下列正确的命题是 ( D )
A.如A,B互斥,则
B. 如A,B相容,则
C. 如A,B互斥,且P(A)>0,P(B)>0,则A.B独立
D. 如A,B独立,则