机器学习实战
文章平均质量分 77
张荣华_csdn
这个作者很懒,什么都没留下…
展开
-
K-近邻算法
《机器学习实战》第2章K-近邻算法from numpy import *import operatorfrom os import listdirdef classify0(inX, dataSet, labels, k): dataSetSize = dataSet.shape[0] diffMat = tile(inX, (dataSetSize,1)) - dataSet #(A...原创 2018-06-03 00:02:52 · 207 阅读 · 0 评论 -
《机器学习实战》第7章 利用AdaBoost元算法提高分类性能(代码)
'''Created on Nov 28, 2010Adaboost is short for Adaptive Boosting@author: Peter'''from numpy import *def loadSimpData(): datMat = matrix([[ 1. , 2.1], [ 2. , 1.1], [ 1.3, 1. ], ...转载 2018-06-23 02:29:06 · 362 阅读 · 0 评论 -
《机器学习实战》第14章 利用SVD简化数据(代码)
'''Created on Mar 8, 2011@author: Peter'''from numpy import *from numpy import linalg as ladef loadExData(): return[[0, 0, 0, 2, 2], [0, 0, 0, 3, 3], [0, 0, 0, 1, 1], ...转载 2018-06-27 00:36:37 · 351 阅读 · 0 评论 -
《机器学习实战》第13章 利用PCA来简化数据(代码)
'''Created on Jun 1, 2011@author: Peter Harrington'''from numpy import *def loadDataSet(fileName, delim='\t'): fr = open(fileName) stringArr = [line.strip().split(delim) for line in fr.readlines...转载 2018-06-27 00:36:26 · 443 阅读 · 0 评论 -
《机器学习实战》第12章 使用FP-growth算法来高效发现频繁项集(代码)
'''Created on Jun 14, 2011FP-Growth FP means frequent patternthe FP-Growth algorithm needs: 1. FP-tree (class treeNode)2. header table (use dict)This finds frequent itemsets similar to apriori but doe...转载 2018-06-26 09:05:50 · 531 阅读 · 0 评论 -
《机器学习实战》 第11章 使用Apriori算法进行关联分析
'''Created on Mar 24, 2011Ch 11 code@author: Peter'''from numpy import *def loadDataSet(): return [[1, 3, 4], [2, 3, 5], [1, 2, 3, 5], [2, 5]]def createC1(dataSet): C1 = [] for transaction in...转载 2018-06-26 09:05:42 · 723 阅读 · 0 评论 -
《机器学习实战》第10章 利用K-均值聚类算法对未标注数据分组(代码)
'''Created on Feb 16, 2011k Means Clustering for Ch10 of Machine Learning in Action@author: Peter Harrington'''from numpy import *def loadDataSet(fileName): #general function to parse tab -delimi...转载 2018-06-25 00:39:37 · 637 阅读 · 0 评论 -
《机器学习实战》第9章 树回归(代码)
'''Created on Feb 4, 2011Tree-Based Regression Methods@author: Peter Harrington'''from numpy import *def loadDataSet(fileName): #general function to parse tab -delimited floats dataMat = [] ...转载 2018-06-25 00:39:29 · 522 阅读 · 0 评论 -
《机器学习实战》第6章支持向量机(代码)
'''Created on Nov 4, 2010Chapter 5 source file for Machine Learing in Action@author: Peter'''from numpy import *from time import sleepdef loadDataSet(fileName): dataMat = []; labelMat = [] fr = ...原创 2018-06-18 10:07:49 · 714 阅读 · 0 评论 -
《机器学习实战》第5章 Logistic回归(代码)
'''Created on Oct 27, 2010Logistic Regression Working Module@author: Peter'''from numpy import *def loadDataSet(): dataMat = []; labelMat = [] fr = open('testSet.txt') for line in fr.readline...原创 2018-06-18 10:07:34 · 403 阅读 · 0 评论 -
《机器学习实战》第4章 基于概率论的分类方法:朴素贝叶斯 代码
'''Created on Oct 19, 2010@author: Peter'''from numpy import *def loadDataSet(): postingList=[['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'], ['maybe', 'not', 'take', 'h...原创 2018-06-14 09:16:06 · 319 阅读 · 2 评论 -
使用决策树预测隐形眼镜类型代码
'''Created on Oct 14, 2010@author: Peter Harrington'''import matplotlib.pyplot as pltdecisionNode = dict(boxstyle="sawtooth", fc="0.8")leafNode = dict(boxstyle="round4", fc="0.8")arrow_args = dict(arr...原创 2018-06-14 09:15:43 · 970 阅读 · 0 评论 -
《机器学习实战》第三章决策树 代码
from math import logimport operatordef calcShannonEnt(dataSet): numEntries=len(dataSet) labelCounts={} for featVec in dataSet: currentLabel=featVec[-1] if currentLabel not in labelCounts.keys(): l...原创 2018-06-14 09:15:34 · 685 阅读 · 0 评论 -
《机器学习实战》第8章 预测数值型数据:回归(代码)
'''Created on Jan 8, 2011@author: Peter'''from numpy import *def loadDataSet(fileName): #general function to parse tab -delimited floats numFeat = len(open(fileName).readline().split('\t')) - ...转载 2018-06-23 02:29:19 · 627 阅读 · 0 评论