数据挖掘
路人张的鱼生
这个作者很懒,什么都没留下…
展开
-
Python数据挖掘入门与实践-OneR分类算法
Python数据挖掘入门与实践-OneR分类算法 OneR算法 OneR算法是根据已有的数据中,具有相同特征值的个体最可能属于哪个类别进行分类。 在本例中,只需选区Iris是个特征中分类效果最好的一个作为分类依据。 使用OneR算法对植物进行分类 离散化 数据集的特征为连续值,把连续值转变为类别行,这个过程叫作离散化。 1、准备数据集 每条数据集中给出了四个特征:sepal length,sepa...原创 2019-03-30 23:54:42 · 438 阅读 · 0 评论 -
Python数据挖掘入门与实践--亲和性分析
Python数据挖掘入门与实践–亲和性分析 说明 这段时间时间找了好多关于数据挖掘方向的数据,不过这些书籍大都偏向理论,看起来也比较枯燥乏味,碰巧今天找到了这本《Python数据挖掘入门与实践》,入门级别,刚好适合我这种爱代码不爱理论的人,从今天开始正式学习数据挖掘。 博客中展示的大部分代码都是按照书中的内容编写出来,有些地方会按照自己的思路有一小部分的改动 亲和性分析定义 亲和性分析根据样本个体...原创 2019-03-27 16:44:02 · 679 阅读 · 0 评论 -
Mapreduce之购物篮分析
Mapreduce之购物篮分析 样例输入 crackers,bread,banana crackers,coke,butter,coffee crackers,bread crackers,bread crackers,bread crackers,bread,coffee butter,coke butter,coke,bread,crackers 样例输出 mapper阶段 package...原创 2019-06-18 20:21:19 · 1253 阅读 · 0 评论