《数据挖掘与机器学习》—— 第六章 关联规则和协同过滤 作业

第六章 关联规则和协同过滤作业及答案

快捷查找:Ctrl+F   在搜索框中输入题目

一. 单选题(共15题)

1. (单选题)当分析顾客消费行业,以便有针对性的向其推荐感兴趣的服务,属于什么问题?

A. 分类

B. 聚类

C. 关联规则

D. 主成分分析

答案: C:关联规则;

2. (单选题)可用作数据挖掘分析中的关联规则算法有(   )。

A. 决策树、对数回归、关联模式

B. K均值法、SOM神经网络

C. Apriori算法、FP-Tree算法

D. RBF神经网络、K均值法、决策树

答案: C:Apriori算法、FP-Tree算法;

3. (单选题)在图集合中发现一组公共子结构,这样的任务称为(   )。

A. 频繁子集挖掘

B. 频繁子图挖掘

C. 频繁数据项挖掘

D. 频繁模式挖掘

答案: B:频繁子图挖掘;

4. (单选题)

某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布. 这种属于数据挖掘的哪类问题?

关联规则就是通过发现顾客放入“购物篮”中的不同商品之间的关联,分析顾客的购物习惯,而物品见的某种联系我们称为关联。这种关联的发现可以帮助零售商了解哪些商品频繁的被顾客同时购买,从而帮助他们开发更好的营销策略。

A. . 关联规则发现

B. 聚类

C. 分类

D. 自然语言处理

答案: A:. 关联规则发现;

5. (单选题)以下哪种算法是关联规则挖掘?

A. DBSCAN  

B.

ID3  

C. K-Means  

D. Apriori

答案: D:Apriori;

6. (单选题)协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度(    ),并将这些用户喜欢的项推荐给有相似兴趣的用户。

A. 相似

B.相同

C. 推荐

D. 预测

答案: D:预测;

7. (单选题)通过数据收集和展示数据背后的(     ),运用丰富的、具有互动性的可视化手段,数据新闻学成为新闻学作为一门新的分支进入主流媒体,即用数据报道新闻。

A. 数据收集

B. 数据挖掘

C. 真相

D. 关联与模式

答案: D:关联与模式;

8. (单选题)发现关联规则的算法通常要经过以下三个步骤:连接数据,作数据准备;给定最小支持度和(       ),利用数据挖掘工具提供的算法发现关联规则;可视化显示、理解、评估关联规则

A. 最小兴趣度

B. 最大置信度

C. 最大支持度

D. 最小可信度

答案: D:最小可信度;

9. (单选题)设X={1,2,3}是频繁项集,则可由X产生(   )个关联规则。

A. 4

B. 5

C. 6

D. 7

答案: C:6;

10. (单选题)推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于 (     ) ,推测客户将来可能的购买行为。

A. 客户的朋友

B. 客户的个人信息

C. 客户的兴趣爱好

D. 客户过去的购买行为和购买记录

答案: D:客户过去的购买行为和购买记录;

11. (单选题)关联规则的评价指标是?(   )

A. 均方误差、均方根误差

B. Kappa统计、显著性检验

C. 支持度、置信度

D. 平均绝对误差、相对误差

答案: C:支持度、置信度;

12. (单选题)协同过滤算法解决的是数据挖掘中的哪类问题(   )

A. 分类问题

B. 聚类问题

C. 推荐问题

D. 自然语言处理问题

答案: C:推荐问题;

13. (单选题)规则I->j,“有可能”,等于所有包含I的购物篮中同时包含J的购物篮的比例,为(      )

A. 关联规则

B. 可信度

C. 兴趣度

D. 支持度

答案: B:可信度;

14. (单选题)Apriori算法的计算复杂度不受影响?(   )

A. 支持度阈值

B. 时间

C. 事务数

D. 项数(维度)

答案: B:时间;

15. (单选题)关于频繁模式,下面哪一个陈述是正确的?

A. K项集频繁则K-1项则必定不频繁

B. K项集频繁则K-1项则必定频繁

C. K项集不频繁则K-1项则必定频繁

D. 以上都不正确

答案: B:K项集频繁则K-1项则必定频繁;

二. 多选题(共2题)

16. (多选题)以下关于非频繁模式说法,正确的是(      )。

A. 其支持度小于阈值

B. 都是不让人感兴趣的

C. 包含负模式和负相关模式

D. 对异常数据项敏感

答案: AD: 其支持度小于阈值; 对异常数据项敏感;

17. (多选题)利用Apriori算法计算频繁项集可以有效降低计算频繁集的时间复杂度。在以下的购物篮中产生支持度不小于3的候选3-项集,在候选2-项集中需要剪枝的是(    )

1 面包、牛奶 2 面包、尿布、啤酒、鸡蛋 3 牛奶、尿布、啤酒、可乐 4 面包、牛奶、尿布、啤酒 5 面包、牛奶、尿布、可乐

A. 啤酒、尿布

B. 啤酒、面包

C. 面包、尿布

D. 啤酒、牛奶

答案: BD:啤酒、面包 ; 啤酒、牛奶;

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
《Python机器学习实战教学——基于协同过滤的电影推荐系统(超详细教学,算法分析)》是一本以协同过滤算法为基础,教授Python机器学习实战技巧的书籍。该书通过详细的教学和算法分析,帮助读者理解和运用协同过滤算法实现电影推荐系统。 协同过滤是一种根据用户历史行为和其他用户间的关系进行推荐的算法。该算法可以通过观察用户的历史观影记录和其他用户的共同观影记录,从而推断用户的个人喜好并给出个性化的电影推荐。 书中首先介绍了协同过滤算法的原理和基本概念,包括用户相似计算、基于用户的协同过滤和基于物品的协同过滤。然后,书中详细解释了如何使用Python进行据预处理和特征工程,如据清洗、特征选择和特征提取等。 接下来,书中介绍了协同过滤算法的具体实现过程。从构建用户-电影评分矩阵开始,通过计算用户间的相似关系,得出用户对未观看电影的评分预测。同,书中还讲解了基于物品的协同过滤算法,以及如何通过计算物品之间的相似来推荐电影。 在算法实现的过程中,书中还给出了详细的代码示例和实战案例,帮助读者理解和掌握算法的具体步骤和实际应用方法。此外,书中还对算法的优化和评估做了深入讲解,帮助读者提高算法的性能和推荐准确。 总的来说,《Python机器学习实战教学——基于协同过滤的电影推荐系统(超详细教学,算法分析)》是一本深入浅出的书籍,通过清晰的教学和详细的算法分析,帮助读者理解和运用协同过滤算法实现电影推荐系统。无论是对Python机器学习的初学者还是已经有一定基础的读者,都能从中受益匪浅。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值