- 博客(56)
- 收藏
- 关注
转载 机器学习第三章代码3-3
选择最好的数据集划分方式# 选择使分割后信息增益最大的特征,即对应的列 def chooseBestFeatureToSplit(dataSet): # 获取特征的数目,从0开始,dataSet[0]是一条数据 numFeatures = len(dataSet[0]) - 1 # 计算数据集当前的信息熵 baseEntropy = Calc
2018-01-26 17:15:06 210
原创 机器学习实战第三章代码3-2注释
按照给定特征划分数据集""splitDataSet函数参数:dataSet为输入数据集,包含label值;axis为每行的第axis元素,value为对应元素的值,即特征值。 函数功能:找出所有行中第axis个元素值为value的行,去掉该元素,返回对应行矩阵当需要按照某个特征值划分数据时,需要将所有符合要求的元素抽取出来,便于计算信息增益,特征之前的就删除啦"""def
2018-01-24 17:43:12 411
原创 机器学习实战代码 第三章3-1注释
# -*- coding: cp936 -*-from math import logdef createDataSet(): dataSet=[[1,1,'yes'], [1,1,'yes'], [1,0,'no'], [0,1,'no'],
2018-01-24 17:36:02 690
原创 机器学习实战代码清单2-6注释
手写数字识别系统的测试代码def handwritingClassTest(): hwLabels=[] trainingFileList=listdir('trainingDigits')#将trainingDigits目录中的文件内容存储在训练列表"trainingFileList"中 m=len(trainingFileList)#得
2018-01-20 18:46:56 523
转载 read,readline与readlines的用法及区别
摘自PYthon核心编程1. read() 方法用来直接读取字节到字符串中, 最多读取给定数目个字节. 如果没有给定 size 参数(默认值为 -1)或者 size 值为负, 文件将被读取直至末尾. 未来的某个版本可能会删除此方法. 2. readline() 方法读取打开文件的一行(读取下个行结束符之前的所有字节). 然后整行,包括行结束符,作为字符串返回. 和 read() 相同, 它
2018-01-20 14:46:42 2754 1
原创 第二章kNN完整代码注释
# -*- coding: cp936 -*- from numpy import * import operatorfrom os import listdirimport time #创建数据集 def createDataSet(): group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])
2018-01-19 16:41:54 432
原创 机器学习代码清单2-5注释
约会网站预测函数def classifyPerson(): resultList=['not at all','in small doses','in large doses']#构建返回的标签向量,这3个标签分别与第1,2,3类相对应,与最后一行代码呼应,海伦之前已经有了1000次的数据,所以我认为那个datingTestSet文件是本程序的结果汇总得到的答案,本身参与程序的是
2018-01-19 15:24:15 449
原创 机器学习实战代码清单2-4注释
分类器针对约会网站的测试代码def datingClassTest(): hoRatio=0.10 datingDataMat,datingLabels=file2matrix('datingTestSet.txt')#读取所有的数据 normMat,ranges,minVals=autoNorm(datingDataMat)#归一化
2018-01-19 14:18:24 439 1
原创 机器学习实战第二章代码清单2-3注释
归一化特征值def autoNorm(dataSet): minVals=dataSet.min(0) #print minVals maxVals=dataSet.max(0) #print maxVals ranges=maxVals-minVals #print ranges
2018-01-18 22:17:56 381
原创 机器学习实战代码清单2-2
约会网站数据将文本纪录转换为Numpy的解析程序:def file2matrix(filename): fr=open(filename) arrayOLines=fr.readlines()#一次读取整个文本数据,并且自动将文件内容分析成一个行的列表,比readline()快 ,后面的img2vector就是使用的readline(),因为
2018-01-18 17:27:10 1073
原创 sorted()&operator.itemgetter()
机器学习实战代码清单2-1中的最后3行代码中:sortedClassCount=sorted(classCount.iteritems(),key=operator.itemgetter(1),reverse=True)书上的注释是:classCount.iteritems()将classCount字典分解为元组列表,operator.itemgetter(1)按照第二个元素的次序对元组进行排序,
2018-01-18 14:38:24 4147 7
转载 Numpy中的anxi的深刻理解
转载自http://blog.csdn.net/fangjian1204/article/details/53055219axis的作用即如何理解numpy是python进行科学计算必不可少的模块,随着深度学习越来越火,numpy也越来越流行。了解numpy的人知道,在numpy中,有很多的函数都涉及到axis,很多函数根据axis的取值不同,得到的结果也完全不同。可以说,axis
2018-01-17 16:20:43 349
原创 Numpy中的tile()函数用法详解
>>> from numpy import *>>> tile([1,2],1)array([1, 2])>>> tile([1,2],2)array([1, 2, 1, 2])上例中,只有一个参数,只向一个维度复制,横向的,或者说在行方向上进行复制下例有两个参数,向两个维度复制,也就是同时向行方向和列方向进行复制>>> tile([1,2],(1,1))array([[
2018-01-17 15:30:12 8418
原创 Numpy中的shape函数的用法详解
shape函数的功能是读取矩阵的长度,比如shape[0]就是读取矩阵第一维度的长度,相当于行数。它的输入参数可以是一个整数表示维度,也可以是一个矩阵。shape函数返回的是一个元组,表示数组(矩阵)的维度,例子如下:1. 数组(矩阵)只有一个维度时,shape只有shape[0],返回的是该一维数组(矩阵)中元素的个数,通俗点说就是返回列数,因为一维数组只有一行,一维情况中array创建的可
2018-01-17 14:25:05 35713
原创 机器学习实战第二章kNN代码清单2-1详细注释
# -*- coding: cp936 -*-from numpy import *import operator#创建数据集def createDataSet(): group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]]) labels=['A','A','B','B'] return gro
2018-01-16 21:02:59 658 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人