数据挖掘
胖大海瘦西湖
乐观,积极进取
展开
-
用python实现c4.5算法,并进行悲观剪枝
#coding=utf-8 import xlrd import xlwt import math import operator from datetime import date,datetime from sklearn import datasets ##计算给定数据集的信息熵 def calcShannonEnt(dataSet): numEntries = len(dataS原创 2015-12-21 13:43:57 · 8552 阅读 · 11 评论 -
spark scala Apriori
val mydata = Array(Array(1,3,4,5),Array(2,3,5),Array(1,2,3,4,5),Array(2,3,4,5)) val pamydata = sc.parallelize(mydata) val C1 = pamydata.flatMap(_.toSet).distinct().collect().map(Set(_)) val D = mydata原创 2016-08-18 10:36:58 · 1915 阅读 · 0 评论 -
Apriori算法的python实现
原始链接:基于Python的机器学习实战:Apriori 原始链接里的代码是在python2下写的,有的地方我看的不是太明白,在这里,我把它修改成能在python3下运行了,还加入了一些方便自己理解的注释。 #coding=utf8 #python3.5 #http://www.cnblogs.com/90zeng/p/apriori.html def loadDataSet():转载 2016-06-04 21:55:51 · 14473 阅读 · 2 评论