大数据与数据挖掘考试题_《大数据时代下的数据挖掘》试题及答案 -

C.聚类分析 D.偏差分析

9) 以下各项均是针对数据仓库的不同说法,你认为正确的有(BCD )。

A.数据仓库就是数据库

B.数据仓库是一切商业智能系统的基础

C.数据仓库是面向业务的,支持联机事务处理(OLTP) D.数据仓库支持决策而非事务处理 10)联机分析处理包括( BCD )基本分析功能。

A.聚类 B.切片 C.转轴 D.切块

11)利用Apriori算法计算频繁项集可以有效降低计算频繁集的时间复杂度。在以下的购物篮中产生支持度不小于3的候选3-项集,在候选2-项集中需要剪枝的是( BD )

TID 1 2 3 4 5

A.啤酒、尿布 B.啤酒、面包 C.面包、尿布 D.啤酒、牛奶

12)下表是一个购物篮,假定支持度阈值为40%,其中( AD )是频繁闭项集。

ID 1 2 3 4 5

项集 面包、牛奶、尿布 面包、牛奶、尿布、啤酒 牛奶、尿布、鸡蛋 面包、尿布、啤酒、鸡蛋 啤酒、鸡蛋 面包、牛奶 面包、尿布、啤酒、鸡蛋 牛奶、尿布、啤酒、可乐 面包、牛奶、尿布、啤酒 面包、牛奶、尿布、可乐 项集 A.面包、牛奶、尿布 B.面包、啤酒 C.尿布、啤酒 D.啤酒、鸡蛋 13)Apriori算法的计算复杂度受( ABCD )影响。

A.支持度阀值 B.项数(维度) C.事务数 D.事务平均宽度 14)以下关于非频繁模式说法,正确的是( AD )

A.其支持度小于阈值 B.都是不让人感兴趣的 C.包含负模式和负相关模式 D.对异常数据项敏感 15)以下属于分类器评价或比较尺度的有: ( ACD )

A.预测准确度 B.召回率 C.模型描述的简洁度 D.计算复杂度 16)贝叶斯信念网络(BBN)有如下哪些特点。 (AB)

A.构造网络费时费力 B.对模型的过分问题非常鲁棒 C.贝叶斯网络不适合处理不完整的数据 D.网络结构确定后,添加变量相当麻烦 17)如下

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值