数据挖掘笔试题(一)

【公众号:深度学习视觉】

⼀. 单项选择题
1.想要了解上海市⼩学⽣的⾝⾼,需要抽取500个样本,这项调查中的样本是?
A.从中抽取的500名学⽣的⾝⾼
B.上海市全部⼩学⽣的⾝⾼
C.从中抽取的500名⼩学⽣
D.上海市全部⼩学⽣

答案:A

2.以下对k-means聚类算法解释正确的是
A.能⾃动识别类的个数,随即挑选初始点为中⼼点计算;
B.能⾃动识别类的个数,不是随即挑选初始点为中⼼点计算;
C.不能⾃动识别类的个数,随即挑选初始点为中⼼点计算;
D.不能⾃动识别类的个数,不是随即挑选初始点为中⼼点计算;

答案:C

3.以下哪个是常⻅的时间序列算法模型
A.RSI
B.MACD
C.ARMA
D.KDJ

答案:C

4.有个袋⼦装有2个红球,2个蓝球,1个⻩球,取出球以后不再放回,请问取两次出来的球是相同颜⾊的概率是多少
A.0.3333
B.0.25
C.0.2
D.0.1667

答案:C

65,8,50,15,37,24,()。括号中的数字是()
A.25
B.26
C.22
D.27

答案:B

6.⼀组数据,均值>中位数>众数,问这组数据
A.左偏
B.右偏
C.钟型
D.对称
答案:B

7.SQL语⾔允许使⽤通配符进⾏字符串匹配的操作,其中‘%’可以表⽰零个字符
A.零个字符;
B.1个字符;
C.多个字符;
D.以上都可以;

答案:D

8.关于正态分布,下列说法错误的是:
A.正态分布具有集中性和对称性;
B.正态分布的均值和⽅差能够决定正态分布的位置和形态;
C.正态分布的偏度为0,峰度为1;
D.标准正态分布的均值为0,⽅差为1;

答案:C

9.在以下不同的场景中,使⽤的分析⽅法不正确的有
A.根据商家最近⼀年的经营及服务数据,⽤聚类算法判断出天猫商家在各⾃主营类下所属的商家层级;
B.根据商家近⼏年的成交数据,⽤聚类算法拟合出⽤户未来⼀个⽉可能的消费⾦额公式;
C.⽤关联规则算法分析出购买了汽⻋坐垫的买家,是否适合推荐汽⻋脚垫;
D.根据⽤户最近购买的商品信息,⽤决策树算法识别出淘宝买家可能是男还是⼥;

答案:B

10.下列时间序列模型中,哪⼀个模型可以较好地拟合波动性的分析和预测
A.AR模型
B.MA模型
C.ARMA模型
D.GARCH模型

答案:D

⼆. 多选选择题

12.现在有M个桶,每桶都有N个乒乓球,乒乓球的颜⾊有K种,并且假设第i个桶第j种颜⾊的球个数为CijC_i^jCij, ⽐例为Rij=CijNR_i^j=\frac{C_i^j}{N}R

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值