代码注释
付修磊
微信公众号 南极Python
展开
-
机器学习实战代码 第三章3-1注释
# -*- coding: cp936 -*-from math import logdef createDataSet(): dataSet=[[1,1,'yes'], [1,1,'yes'], [1,0,'no'], [0,1,'no'],原创 2018-01-24 17:36:02 · 690 阅读 · 0 评论 -
第二章kNN完整代码注释
# -*- coding: cp936 -*- from numpy import * import operatorfrom os import listdirimport time #创建数据集 def createDataSet(): group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])原创 2018-01-19 16:41:54 · 432 阅读 · 0 评论 -
机器学习实战代码清单2-2
约会网站数据将文本纪录转换为Numpy的解析程序:def file2matrix(filename): fr=open(filename) arrayOLines=fr.readlines()#一次读取整个文本数据,并且自动将文件内容分析成一个行的列表,比readline()快 ,后面的img2vector就是使用的readline(),因为原创 2018-01-18 17:27:10 · 1073 阅读 · 0 评论 -
机器学习实战第二章kNN代码清单2-1详细注释
# -*- coding: cp936 -*-from numpy import *import operator#创建数据集def createDataSet(): group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]]) labels=['A','A','B','B'] return gro原创 2018-01-16 21:02:59 · 658 阅读 · 2 评论 -
机器学习代码清单2-5注释
约会网站预测函数def classifyPerson(): resultList=['not at all','in small doses','in large doses']#构建返回的标签向量,这3个标签分别与第1,2,3类相对应,与最后一行代码呼应,海伦之前已经有了1000次的数据,所以我认为那个datingTestSet文件是本程序的结果汇总得到的答案,本身参与程序的是原创 2018-01-19 15:24:15 · 449 阅读 · 0 评论 -
机器学习实战代码清单2-4注释
分类器针对约会网站的测试代码def datingClassTest(): hoRatio=0.10 datingDataMat,datingLabels=file2matrix('datingTestSet.txt')#读取所有的数据 normMat,ranges,minVals=autoNorm(datingDataMat)#归一化原创 2018-01-19 14:18:24 · 439 阅读 · 1 评论 -
机器学习实战第二章代码清单2-3注释
归一化特征值def autoNorm(dataSet): minVals=dataSet.min(0) #print minVals maxVals=dataSet.max(0) #print maxVals ranges=maxVals-minVals #print ranges原创 2018-01-18 22:17:56 · 381 阅读 · 0 评论 -
机器学习第三章代码3-3
选择最好的数据集划分方式# 选择使分割后信息增益最大的特征,即对应的列 def chooseBestFeatureToSplit(dataSet): # 获取特征的数目,从0开始,dataSet[0]是一条数据 numFeatures = len(dataSet[0]) - 1 # 计算数据集当前的信息熵 baseEntropy = Calc转载 2018-01-26 17:15:06 · 210 阅读 · 0 评论 -
机器学习实战代码3-5
使用文本注解绘制树节点# -*- coding: cp936 -*-#利用matplotlib的注解(注释)来绘制决策树(奇葩不)import matplotlib.pyplot as plt#引入中文字体from pylab import * mpl.rcParams['font.sans-serif'] = ['SimHei'] #定义文本框和箭头格式decision原创 2018-02-02 15:18:20 · 274 阅读 · 0 评论 -
机器学习实战代码3-5
**使用文本注解绘制树节点# -*- coding: cp936 -*-#利用matplotlib的注解(注释)来绘制决策树(奇葩不)import matplotlib.pyplot as plt#引入中文字体from pylab import * mpl.rcParams['font.sans-serif'] = ['SimHei'] #定义文本框和箭头格式deci原创 2018-02-02 15:11:56 · 249 阅读 · 0 评论 -
机器学习实战代码3-4
def createTree(dataSet,labels): classList = [example[-1] for example in dataSet] if classList.count(classList[0]) == len(classList): return classList[0]#stop splitting when all of the原创 2018-02-01 21:19:30 · 384 阅读 · 0 评论 -
机器学习实战第三章代码3-2注释
按照给定特征划分数据集""splitDataSet函数参数:dataSet为输入数据集,包含label值;axis为每行的第axis元素,value为对应元素的值,即特征值。 函数功能:找出所有行中第axis个元素值为value的行,去掉该元素,返回对应行矩阵当需要按照某个特征值划分数据时,需要将所有符合要求的元素抽取出来,便于计算信息增益,特征之前的就删除啦"""def原创 2018-01-24 17:43:12 · 411 阅读 · 0 评论 -
机器学习实战代码清单2-6注释
手写数字识别系统的测试代码def handwritingClassTest(): hwLabels=[] trainingFileList=listdir('trainingDigits')#将trainingDigits目录中的文件内容存储在训练列表"trainingFileList"中 m=len(trainingFileList)#得原创 2018-01-20 18:46:56 · 523 阅读 · 0 评论