付修磊-CSDN博客

转载机器学习第三章代码3-3

选择最好的数据集划分方式# 选择使分割后信息增益最大的特征，即对应的列 def chooseBestFeatureToSplit(dataSet): # 获取特征的数目，从0开始，dataSet[0]是一条数据 numFeatures = len(dataSet[0]) - 1 # 计算数据集当前的信息熵 baseEntropy = Calc

2018-01-26 17:15:06 210

原创机器学习实战第三章代码3-2注释

按照给定特征划分数据集""splitDataSet函数参数：dataSet为输入数据集，包含label值；axis为每行的第axis元素，value为对应元素的值，即特征值。函数功能：找出所有行中第axis个元素值为value的行，去掉该元素，返回对应行矩阵当需要按照某个特征值划分数据时,需要将所有符合要求的元素抽取出来，便于计算信息增益，特征之前的就删除啦"""def

2018-01-24 17:43:12 411

原创机器学习实战代码第三章3-1注释

# -*- coding: cp936 -*-from math import logdef createDataSet(): dataSet=[[1,1,'yes'], [1,1,'yes'], [1,0,'no'], [0,1,'no'],

2018-01-24 17:36:02 690

原创 os模块中的listdir（）函数

获取指定目录或文件夹下所包含的项目的名字

2018-01-20 21:03:33 1141

原创机器学习实战代码清单2-6注释

手写数字识别系统的测试代码def handwritingClassTest(): hwLabels=[] trainingFileList=listdir('trainingDigits')#将trainingDigits目录中的文件内容存储在训练列表"trainingFileList"中 m=len(trainingFileList)#得

2018-01-20 18:46:56 523

转载 read，readline与readlines的用法及区别

摘自PYthon核心编程1. read() 方法用来直接读取字节到字符串中, 最多读取给定数目个字节. 如果没有给定 size 参数(默认值为 -1)或者 size 值为负, 文件将被读取直至末尾. 未来的某个版本可能会删除此方法. 2. readline() 方法读取打开文件的一行(读取下个行结束符之前的所有字节). 然后整行，包括行结束符，作为字符串返回. 和 read() 相同, 它

2018-01-20 14:46:42 2754 1

原创第二章kNN完整代码注释

# -*- coding: cp936 -*- from numpy import * import operatorfrom os import listdirimport time #创建数据集 def createDataSet(): group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])

2018-01-19 16:41:54 432

原创机器学习代码清单2-5注释

约会网站预测函数def classifyPerson(): resultList=['not at all','in small doses','in large doses']#构建返回的标签向量，这3个标签分别与第1，2，3类相对应，与最后一行代码呼应，海伦之前已经有了1000次的数据，所以我认为那个datingTestSet文件是本程序的结果汇总得到的答案，本身参与程序的是

2018-01-19 15:24:15 449

原创机器学习实战代码清单2-4注释

分类器针对约会网站的测试代码def datingClassTest(): hoRatio=0.10 datingDataMat,datingLabels=file2matrix('datingTestSet.txt')#读取所有的数据 normMat,ranges,minVals=autoNorm(datingDataMat)#归一化

2018-01-19 14:18:24 439 1

原创机器学习实战第二章代码清单2-3注释

归一化特征值def autoNorm(dataSet): minVals=dataSet.min(0) #print minVals maxVals=dataSet.max(0) #print maxVals ranges=maxVals-minVals #print ranges

2018-01-18 22:17:56 381

原创机器学习实战代码清单2-2

约会网站数据将文本纪录转换为Numpy的解析程序：def file2matrix(filename): fr=open(filename) arrayOLines=fr.readlines()#一次读取整个文本数据，并且自动将文件内容分析成一个行的列表，比readline（）快，后面的img2vector就是使用的readline（），因为

2018-01-18 17:27:10 1073

原创 sorted（）&operator.itemgetter（）

机器学习实战代码清单2-1中的最后3行代码中：sortedClassCount=sorted(classCount.iteritems(),key=operator.itemgetter(1),reverse=True)书上的注释是：classCount.iteritems()将classCount字典分解为元组列表，operator.itemgetter(1)按照第二个元素的次序对元组进行排序，

2018-01-18 14:38:24 4147 7

转载 Numpy中的anxi的深刻理解

转载自http://blog.csdn.net/fangjian1204/article/details/53055219axis的作用即如何理解numpy是python进行科学计算必不可少的模块，随着深度学习越来越火，numpy也越来越流行。了解numpy的人知道，在numpy中，有很多的函数都涉及到axis，很多函数根据axis的取值不同，得到的结果也完全不同。可以说，axis

2018-01-17 16:20:43 349

原创 Numpy中的tile（）函数用法详解

>>> from numpy import *>>> tile([1,2],1)array([1, 2])>>> tile([1,2],2)array([1, 2, 1, 2])上例中，只有一个参数，只向一个维度复制，横向的，或者说在行方向上进行复制下例有两个参数，向两个维度复制，也就是同时向行方向和列方向进行复制>>> tile([1,2],(1,1))array([[

2018-01-17 15:30:12 8418

原创 Numpy中的shape函数的用法详解

shape函数的功能是读取矩阵的长度，比如shape[0]就是读取矩阵第一维度的长度,相当于行数。它的输入参数可以是一个整数表示维度，也可以是一个矩阵。shape函数返回的是一个元组，表示数组（矩阵）的维度，例子如下：1. 数组（矩阵）只有一个维度时，shape只有shape[0]，返回的是该一维数组（矩阵）中元素的个数，通俗点说就是返回列数，因为一维数组只有一行，一维情况中array创建的可

2018-01-17 14:25:05 35713

原创机器学习实战第二章kNN代码清单2-1详细注释

# -*- coding: cp936 -*-from numpy import *import operator#创建数据集def createDataSet(): group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]]) labels=['A','A','B','B'] return gro

2018-01-16 21:02:59 658 2

雨落狮山山亦奇的个人博客