数据挖掘/机器学习算法实现
Laurel1115
这个作者很懒,什么都没留下…
展开
-
Python两步实现关联规则Apriori算法,参考机器学习实战,包括频繁项集的构建以及关联规则的挖掘
Apriori算法的实现一、构建频繁项集(注释都在代码中了)二、基于构造出的频繁项集挖掘关联规则(注释都在代码中了)这是我学习了关联规则Apriori算法原理后参照《机器学习实战》实现的算法代码,首先分为两个部分,第一部分是频繁项集的构建,第二部分是关联规则的挖掘。特别的是我的测试数据也就是loadDataSet()函数中的数据进行了改变,这是为了能帮助理解第二部分。然后代码中我加了很多为了让自...原创 2019-02-26 15:38:15 · 2829 阅读 · 2 评论 -
Python四步实现决策树ID3算法,参考机器学习实战
决策树ID3算法的python实现一、编写计算历史数据的经验熵函数二、按照指定特征和其特征值来划分数据集三、计算每个特征的熵,求得信息增益,返回使得信息增益最大的特征四、递归构建决策树(一)定义叶子节点中的实例类别(二)、构造决策树五、创建实例测试算法六、利用以上实现的算法实现决策树分类,需要递归遍历整棵决策树一、编写计算历史数据的经验熵函数from math import logdef c...原创 2019-02-26 16:01:32 · 827 阅读 · 0 评论 -
python实现PCA算法,参考机器学习实战
python实现PCA算法def pca(dataMat, topNfeat=9999999): meanVals = mean(dataMat, axis=0)#求每一维特征的平均值 meanRemoved = dataMat - meanVals #中心化 covMat = cov(meanRemoved, rowvar=0)#求特征间的协方差矩阵 eigVa...原创 2019-03-05 17:38:02 · 1391 阅读 · 0 评论 -
python实现CART回归树,参考机器学习实战
python实现CART回归树一、二分化数据集二、进行最优划分(选择最优特征及最优切分点)三、递归构造树一、二分化数据集def binSplitDataSet(dataSet, feature, value): mat0 = dataSet[nonzero(dataSet[:, feature] > value)[0], :] mat1 = dataSet[nonzero...原创 2019-03-04 15:21:14 · 732 阅读 · 0 评论