机器学习实战
dy豆芽
这个作者很懒,什么都没留下…
展开
-
机器学习实战代码详解(七)利用AdaBoost元算法提高分类性能
#coding=utf-8from numpy import *def loadSimpData(): dataMat = matrix([[1.0, 2.1], [2.0, 1.1], [1.3, 1.0], [1.0, 1.0],原创 2017-10-09 20:41:46 · 299 阅读 · 0 评论 -
机器学习实战代码详解(九)树回归
regCART.py#coding=utf-8from numpy import *def loadDataSet(fileName): dataMat = [] fr = open(fileName) for line in fr.readlines(): curLine = line.strip().split('\t') fltLine原创 2017-10-18 17:19:18 · 558 阅读 · 0 评论 -
机器学习实战代码详解(四)朴素贝叶斯
#coding=utf-8from numpy import *#--------词表到向量对转换函数---------#创建实验样本def loadDataSet(): postingList = [['my', 'dog', 'has', 'flea', 'problem', 'help', 'please'], ['maybe', 'not原创 2017-10-04 21:48:09 · 637 阅读 · 0 评论 -
python机器学习实战 getA()函数详解
在机器学习实战一书的第五章中出现了getA()这个函数logRegres.plotBestFit(weight.getA())当输入下下代码时logRegres.plotBestFit(weight)会出现错误,原因在于下面这一段代码中len(x) = 60, 而len(y) = 1 x = arange(-3.0, 3.0, 0.1) y = (-weights[0] - weights[1]原创 2017-10-05 17:01:09 · 7128 阅读 · 1 评论 -
机器学习实战代码详解(八)预测数值型数据:回归
#coding=utf-8#数据导入行数from numpy import *def loadDataSet(fileName): numFeat = len(open(fileName).readline().split('\t')) - 1 dataMat = []; labelMat = [] fr = open(fileName) for line in原创 2017-10-11 16:33:11 · 457 阅读 · 0 评论 -
机器学习实战代码详解(五)Logistic回归
#coding=utf-8from numpy import *#----------加载数据-------------def loadDataSet(): dataMat = []; labelMat = [] fr = open('testSet.txt') #读取样本 for line in fr.readlines(): lin原创 2017-10-06 15:50:44 · 860 阅读 · 0 评论 -
机器学习实战代码详解(11)使用Apriori算法进行关联分析
#coding=utf-8def loadDataSet(): return [[1, 3, 4], [2, 3, 5], [1, 2, 3, 5], [2, 5]]#创建集合C1,集合C1为所有大写为1的候选集的集合def createC1(dataSet): C1 = [] for transation in dataSet: for item in t原创 2017-10-29 15:37:21 · 476 阅读 · 0 评论 -
机器学习实战代码详解(12)使用FP-growth算法来高效发现频繁集
#coding=utf-8#树节点结构定义class treeNode: def __init__(self, nameValue, numOccur, parentNode): self.name = nameValue self.count = numOccur self.nodeLink = None self.par原创 2017-10-30 17:19:17 · 569 阅读 · 0 评论