课堂：Apriori + 关联规则

我是小白新新

已于 2024-03-15 21:25:26 修改

阅读量847

点赞数 21

分类专栏：数据挖掘课程文章标签：数据挖掘

于 2024-03-15 21:23:47 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/youho111/article/details/136750065

版权

数据挖掘课程专栏收录该内容

6 篇文章 0 订阅

订阅专栏

一．小结

本小节主要是学习关联规则，但是学习这个之前，我们要学习Apriori算法求的频繁集。

二．实操演示

（1）处理数据集

导入数据

#导入数据

import pandas as pd

path = 'C:\\Users\\chxy\\Desktop\\data\\store_data.csv'

records = pd.read_csv(path,header=None,encoding='utf-8',na_filter=False)

#na_filter=False，表示空值导入后会显示为空，而不是NaN

print(records)

对数据集进行编码

#对交易数据进行one-hot编码

from mlxtend.preprocessing import TransactionEncoder

TE = TransactionEncoder()#类实例化

one_hot_records = TE.fit(lst_records).transform(lst_records)

print(one_hot_records)

改正后:

import mlxtend

#对交易数据进行one-hot编码

from mlxtend.preprocessing import TransactionEncoder

TE = TransactionEncoder()#类实例化

lst_records = records.values.tolist()

one_hot_records = TE.fit(lst_records).transform(lst_records)

print(one_hot_records)

3.

#数据格式转为数据框

df_records = pd.DataFrame(data = one_hot_records,columns = TE.columns_)

print(df_records)

4.

#挖掘频繁项集

from mlxtend.frequent_patterns import apriori

freq_items = apriori(df_records,min_support=0.05,use_colnames=True)

print(freq_items)

（2）关联规则

5挖掘关联规则

#挖掘关联规则

from mlxtend.frequent_patterns import association_rules

association_rules_1 = association_rules(freq_items,metric='confidence',min_threshold=0.2)

print(association_rules_1)

6.导出关联规则挖掘结果

#导出关联规则挖掘结果

association_rules_1.to_csv(path_or_buf='C:\\Users\\Administrator\\Desktop\\association_rules.csv')

三.课后练习P75+P77

我是小白新新

关注

21
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

我是小白新新 CSDN认证博客专家 CSDN认证企业博客

码龄2年

54: 原创

110万+: 周排名

4万+: 总排名

1万+: 访问

: 等级

790: 积分

195: 粉丝

248: 获赞

8: 评论

243: 收藏

私信

关注

热门文章

分类专栏

最新评论

SQL连接Python
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
JAVA项目-学生管理（先导课数组与集合1）
CSDN-Ada助手: Java 技能树或许可以帮到你：https://edu.csdn.net/skill/java?utm_source=AI_act_java
集合之List定义++遍历+使用
CSDN-Ada助手: 恭喜作者在博客中对List的定义、遍历和使用进行了详细地阐述，内容十分丰富。希望作者能够继续保持创作的热情，不断分享自己的学习心得和经验。下一步建议可以尝试探讨List与其他数据结构的对比和应用场景，或者结合具体的项目实例进行讲解，让读者更加深入地理解List的使用方法。期待作者更多精彩的博客！
Set定义＋使用
CSDN-Ada助手: 恭喜您写下了第17篇博客！标题中的“Set定义＋使用”让我想到了您在这篇博客中可能会介绍Set的基本概念以及如何在实际编程中使用它们。这是一个非常有用的主题，因为Set在数据结构中扮演着重要的角色。我希望您能在博客中详细说明Set的定义和用法，并提供一些实际的例子来帮助读者更好地理解。如果可能的话，您还可以探讨一些Set的高级特性或一些实际应用场景，这将进一步丰富您的内容。再次恭喜您的创作，期待您在下一篇博客中的精彩分享！请继续保持创作的热情，我相信您的博客会给读者带来更多的启发和帮助。
CircleTry(1):双层循环
CSDN-Ada助手: 恭喜你写了第7篇博客！看到你不断创作，真是非常令人欣慰。标题“循环-习题”让我感到很期待，希望能在你的博客中学到更多关于循环的知识和技巧。作为下一步的创作建议，或许你可以考虑分享一些实际应用场景中使用循环解决问题的例子，这样读者可以更好地理解循环的实用性。再次恭喜你，期待你未来更多精彩的博客！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。