笔试

以下哪些分类方法可以较好地避免样本的不平衡问题(a)

A KNN

B SVM

C Bayes

D 神经网络

2. 什么是KDD?(a)

A 数据挖掘与知识发现

B 领域知识发现

C 文档知识发现

D 动态知识发现
解题思路:知识发现(KDD : Knowledge Discovery in Database )是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。


3. 当不知道数据所带标签时,可以使用哪种技术促使带同类标签约数据与带其他标签的数据相分离?()

A 分类

B 聚类

C 关联分析

D 隐马尔可夫链

信管网参考答案:B聚类

4. 在有指导的数据挖掘中,有关测试集的说法错误的是(a)

A 测试集与训练集是独立同分布的

B 测试集是用以测试模型的数据集

C 通常测试集大约占总样本的三分之一

D K-次交叉验证中,测试集只有1个、训练集有K-1个

5. 假设12个销售价格记录组已经排序如下:5、10、11、13、15、35、50、55、72、92、204、215使用如下每种方法将它们划分成四个箱。等宽划分时(宽度为50),15又在哪个箱子里?(b)

A 第一个

B 第二个

C 第三个

D 第四个

6. 下面关于时间系列分析与回归分析的关系中,错误的是(D)

A 时间序列分析方法明确强调变量值顺序的重要性,而回归分析方法则不必如此
B 时间序列各观察值之间存在一定的依存关系,而回归分析一般要求每一变量各自独立

C 时间序列分析根据序列自身的变化规律来预测未来,而其它统计分析则根据某一变量与其它变量间的因果关系来预测该变量的未来

D 时间序列分析就是以时间变量为自变量、时间序列为因变量的回归分析

7. 在图集合中发现一组公共子结构,这样的任务称为(b)

A 频繁子集挖掘

B 频繁子图挖掘

C 频繁数据项挖掘

D 频繁模式挖掘

8. 以下哪些算法是分类算法(b)

A DBSCAN

B C4.5

C K-Mean

D EM
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Captain_Data

打赏一下~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值