power bi和python互联_Power BI x Python 关联分析(下)

本文介绍了如何在Power BI中使用Python进行关联分析,包括数据预处理、Apriori算法的应用,以及如何在Power Query中处理结果,以生成Power BI原生数据集。虽然这种方法提供了灵活性和可扩展性,但无法通过切片器即时改变数据源的计算范围。
摘要由CSDN通过智能技术生成

前言

上回提到,Power BI借助Python做关联分析,可以轻松地找出物品中的频繁项集,且该频繁项集内的物品数量不限于2个。实现方式既可以通过Power BI里添加Python可视化控件直接生成Python式图表,也可在PQ里借助Python处理数据。前者最大的好处体现在与切片器联动中,是即时计算新的频繁项集。不足在于Python图表的风格与Power BI不一致,而且由于直接输出Python图(没有输出数据源),不便于开展其他分析。后者,正好解决了这些不足。

方法

首先点击【转换数据】进入Power Query(PQ)界面。

接下来,我们复制一份源数据。因为在PQ里用Python进行数据清洗,实际上会修改覆盖掉原来的这份数据记录,所以复制一份以便备份。

再接下来,是用Python清洗数据的关键。网上同类话题的文献都讲的比较简单,这里把每一步截图给大家看看。如图所示依次点开Python编辑器。编辑器中输入输出都是Python的DataFrame数据结构。打开后,系统默认将数据源转成DataFrame的dataset。也即在此编辑器中,已经有了数据dataset。

2. 将上篇推文那段Apriori算法的代码复制到此编辑器。区别是,之前需要输入图表,而这次无需,因此可以把最后几行代码删掉。输入的代码如下:

from mlxtend.frequent_patterns import apriori

from mlxtend.preprocess

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值