山东大学2019-2020数据仓库与数据挖掘期末考试

一、
1.数据分析的步骤,每个步骤都干啥
2.数据仓库的特点,解释
3.大数据4v理论
4.数据流概念,难点是什么,解决方案的特点
5.检测离群点的四种方法
二、
1、给出三个维度(item,time,location)两个度量构建星型模型
2、想要得到2017第一季度的所有品牌销售状况,进行哪些olap操作
三、
1.数据仓库的体系结构图
2.解释每个层的作用
3.数据集市的定义
4.molap的原理
四、
给出几个点,进行k-means
1.列出每次的聚类结果
2. 写出第三次聚类的详细过程
五、
Fp树的构建
寻找t的条件模式基
六、
决策树的思想、两种类型是什么
给出离散化的标准,列出符合某一个标准的数据集
将决策树转化为判断过程
给出一个条件,判断是否会购买(写过程)
树中有一个?,判断?应该是什么,说出理由
七、
给出abcdef几个商品,ABCDEF几个用户
给出F喜欢的商品abd,给出用户喜欢的商品列表
1.应该用哪种推荐算法,算法思想是什么
2.应该给F推荐哪个商品

题量很大,希望能帮到要考这门课的同学

By naggy

  • 6
    点赞
  • 58
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值