C.聚类分析 D.偏差分析
9) 以下各项均是针对数据仓库的不同说法,你认为正确的有(BCD )。
A.数据仓库就是数据库
B.数据仓库是一切商业智能系统的基础
C.数据仓库是面向业务的,支持联机事务处理(OLTP) D.数据仓库支持决策而非事务处理 10)联机分析处理包括( BCD )基本分析功能。
A.聚类 B.切片 C.转轴 D.切块
11)利用Apriori算法计算频繁项集可以有效降低计算频繁集的时间复杂度。在以下的购物篮中产生支持度不小于3的候选3-项集,在候选2-项集中需要剪枝的是( BD )
TID 1 2 3 4 5
A.啤酒、尿布 B.啤酒、面包 C.面包、尿布 D.啤酒、牛奶
12)下表是一个购物篮,假定支持度阈值为40%,其中( AD )是频繁闭项集。
ID 1 2 3 4 5
项集 面包、牛奶、尿布 面包、牛奶、尿布、啤酒 牛奶、尿布、鸡蛋 面包、尿布、啤酒、鸡蛋 啤酒、鸡蛋 面包、牛奶 面包、尿布、啤酒、鸡蛋 牛奶、尿布、啤酒、可乐 面包、牛奶、尿布、啤酒 面包、牛奶、尿布、可乐 项集 A.面包、牛奶、尿布 B.面包、啤酒 C.尿布、啤酒 D.啤酒、鸡蛋 13)Apriori算法的计算复杂度受( ABCD )影响。
A.支持度阀值 B.项数(维度) C.事务数 D.事务平均宽度 14)以下关于非频繁模式说法,正确的是( AD )
A.其支持度小于阈值 B.都是不让人感兴趣的 C.包含负模式和负相关模式 D.对异常数据项敏感 15)以下属于分类器评价或比较尺度的有: ( ACD )
A.预测准确度 B.召回率 C.模型描述的简洁度 D.计算复杂度 16)贝叶斯信念网络(BBN)有如下哪些特点。 (AB)
A.构造网络费时费力 B.对模型的过分问题非常鲁棒 C.贝叶斯网络不适合处理不完整的数据 D.网络结构确定后,添加变量相当麻烦 17)如下