python
文章平均质量分 89
杂草莉
这个作者很懒,什么都没留下…
展开
-
FP-growth算法通俗讲解
FP-growth算法是一种高效发现频繁集的方法。例如你在搜索引擎中搜索一个词,它会自从补全查询词项,该处用到了FP-growth算法,通过查看互联网上的用词来找出经常在一块出现的词。【FP(Frequent Pattern)】 FP-growth算法基于Apriori算法,但是比Apriori算法执行速度快,通常性能要好两个数量级以上。FP-growth算法虽然能更高效地发现频繁项集,但是不能用于发现关联规则。 FP-growth算法将数据集存储在一个特定的F...原创 2020-11-29 13:29:21 · 5811 阅读 · 0 评论 -
Apriori算法通俗讲解
一、Apriori算法简介 Apriori算法用于解决大规模数据集的关联分析问题。关联分析(association analysis)或关联规则学习(association rule learning)是从大规模数据集中寻找物品间的隐含关系。但是,寻找物品的不同组合是一项十分耗时的任务,计算代价高,蛮力搜索并不能解决问题,所以需要更智能的方法在合理时间范围内找到频繁项集。Apriori算法就是解决这个问题的。二、关联分析 关联分析是一种在大规模数据集中寻找有趣关系的任务。...原创 2020-10-05 21:20:27 · 12012 阅读 · 3 评论 -
AdaBoost算法通俗讲解
AdaBoost是元算法中最流行的一种,也被认为是最好的监督学习的方法 。一、元算法 元算法(meta-algorithm),也被称作集成方法(ensemble method),是对其他算法进行组合的一种方式,将不同的分类器组合起来的结果。使用集成方法时有多种形式:可以是不同算法的集成,也可以是同一算法在不同设置下的集成,还可以是数据集不同部分分配给不同分类器之后的集成。 下面介绍基于同一种分类器多个不同实例的两种计算方法bagging和boosting。 ...原创 2020-07-20 18:44:51 · 1573 阅读 · 0 评论 -
Python读取excel数据且横轴是日期的图像绘制
Python的matplotlib包含很多图表函数,其中plot()函数是绘制坐标图的。通常情况下,横轴和纵轴都是数值型数据很好画图,直接带入数据,坐标轴会自动调节大小和显示密度。但是当横轴是日期时,且从excel文件读取数据时,有一点麻烦。遇到的问题:1. 首先,excel里的日期显示不正常。2. 横轴日期的显示不理想,或太密集或太松弛。解决:1. 方法一:修改excel...原创 2020-04-27 11:43:09 · 6824 阅读 · 0 评论