山东大学2018-2019年第二学期 数据仓库数据挖掘 期末考试题 回忆版

第一大题
1.什么是大数据的4V
2.数据仓库的体系结构,画图并说明。
3.忘了:)

第二大题 给定三个维度和两个度量
(1)按要求画出OLAP的星形模型
(2)欲提取条件=XXX的数据,应该执行哪些OLAP的操作
(3)指出MOLAP和 ROLAP各自的优缺点
除了(3),套路和课本第四章课后练习题几乎完全一致。

第三大题
(1)数据泛化,数据操作符是什么
(2)一个表格,表格 中的数据要求按标准泛化
表格 的列是ID,姓名,收入,年龄,等等,buys = yes or no
(3)朴素贝叶斯分类。给一个收入=xx,年龄=xx,预测分类是买还是不买

第四大题
(1)fp-growth算法,画出某个事物数据库的FP树,无新意。(2)挖掘给定项的条件FP树,写出挖掘出的频繁项集结果

第五大题 有13个点,给了点之间的距离矩阵,参数:MinPts=3, epsilon=3
用DBSCAN算法聚类,写出聚类结果和步骤。(2)给出核心点,和什么密度可达之类的(具体的忘了,我没复习DBSCAN,直接爆炸,概念也不清楚)

第六大题
PPT补充的流数据挖掘例题,基本是原题。给了窗口,进来的数据是某某二进制串,画出进来之后的各个段和最终结果。

这个ppt也没复习,结果自然是欢声笑语中打出GG。

一点点复习建议:认真做一下课本的例题,和课后习题,对不熟练的部分甚至可以多做几遍。课后习题解答在教师手册中,可使用Bing国际版搜索 课本英文名字+Instructor’s manual获得pdf,稍后我也会上传到csdn上。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值