自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

雨落狮山山亦奇的个人博客

欢迎一起来学Python呀!

  • 博客(56)
  • 收藏
  • 关注

转载 机器学习第三章代码3-3

选择最好的数据集划分方式# 选择使分割后信息增益最大的特征,即对应的列 def chooseBestFeatureToSplit(dataSet): # 获取特征的数目,从0开始,dataSet[0]是一条数据 numFeatures = len(dataSet[0]) - 1 # 计算数据集当前的信息熵 baseEntropy = Calc

2018-01-26 17:15:06 210

原创 机器学习实战第三章代码3-2注释

按照给定特征划分数据集""splitDataSet函数参数:dataSet为输入数据集,包含label值;axis为每行的第axis元素,value为对应元素的值,即特征值。 函数功能:找出所有行中第axis个元素值为value的行,去掉该元素,返回对应行矩阵当需要按照某个特征值划分数据时,需要将所有符合要求的元素抽取出来,便于计算信息增益,特征之前的就删除啦"""def

2018-01-24 17:43:12 411

原创 机器学习实战代码 第三章3-1注释

# -*- coding: cp936 -*-from math import logdef createDataSet():         dataSet=[[1,1,'yes'],                  [1,1,'yes'],                  [1,0,'no'],                  [0,1,'no'], 

2018-01-24 17:36:02 690

原创 os模块中的listdir()函数

获取指定目录或文件夹下所包含的项目的名字

2018-01-20 21:03:33 1141

原创 机器学习实战代码清单2-6注释

手写数字识别系统的测试代码def handwritingClassTest(): hwLabels=[] trainingFileList=listdir('trainingDigits')#将trainingDigits目录中的文件内容存储在训练列表"trainingFileList"中 m=len(trainingFileList)#得

2018-01-20 18:46:56 523

转载 read,readline与readlines的用法及区别

摘自PYthon核心编程1. read() 方法用来直接读取字节到字符串中, 最多读取给定数目个字节. 如果没有给定 size 参数(默认值为 -1)或者 size 值为负, 文件将被读取直至末尾. 未来的某个版本可能会删除此方法. 2. readline() 方法读取打开文件的一行(读取下个行结束符之前的所有字节). 然后整行,包括行结束符,作为字符串返回. 和 read() 相同, 它

2018-01-20 14:46:42 2754 1

原创 第二章kNN完整代码注释

# -*- coding: cp936 -*-  from numpy import *  import operatorfrom os import listdirimport time  #创建数据集  def createDataSet():           group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])       

2018-01-19 16:41:54 432

原创 机器学习代码清单2-5注释

约会网站预测函数def classifyPerson(): resultList=['not at all','in small doses','in large doses']#构建返回的标签向量,这3个标签分别与第1,2,3类相对应,与最后一行代码呼应,海伦之前已经有了1000次的数据,所以我认为那个datingTestSet文件是本程序的结果汇总得到的答案,本身参与程序的是

2018-01-19 15:24:15 449

原创 机器学习实战代码清单2-4注释

分类器针对约会网站的测试代码def datingClassTest(): hoRatio=0.10 datingDataMat,datingLabels=file2matrix('datingTestSet.txt')#读取所有的数据 normMat,ranges,minVals=autoNorm(datingDataMat)#归一化

2018-01-19 14:18:24 439 1

原创 机器学习实战第二章代码清单2-3注释

归一化特征值def autoNorm(dataSet): minVals=dataSet.min(0) #print minVals maxVals=dataSet.max(0) #print maxVals ranges=maxVals-minVals #print ranges

2018-01-18 22:17:56 381

原创 机器学习实战代码清单2-2

约会网站数据将文本纪录转换为Numpy的解析程序:def file2matrix(filename):           fr=open(filename)           arrayOLines=fr.readlines()#一次读取整个文本数据,并且自动将文件内容分析成一个行的列表,比readline()快 ,后面的img2vector就是使用的readline(),因为

2018-01-18 17:27:10 1073

原创 sorted()&operator.itemgetter()

机器学习实战代码清单2-1中的最后3行代码中:sortedClassCount=sorted(classCount.iteritems(),key=operator.itemgetter(1),reverse=True)书上的注释是:classCount.iteritems()将classCount字典分解为元组列表,operator.itemgetter(1)按照第二个元素的次序对元组进行排序,

2018-01-18 14:38:24 4147 7

转载 Numpy中的anxi的深刻理解

转载自http://blog.csdn.net/fangjian1204/article/details/53055219axis的作用即如何理解numpy是python进行科学计算必不可少的模块,随着深度学习越来越火,numpy也越来越流行。了解numpy的人知道,在numpy中,有很多的函数都涉及到axis,很多函数根据axis的取值不同,得到的结果也完全不同。可以说,axis

2018-01-17 16:20:43 349

原创 Numpy中的tile()函数用法详解

>>> from numpy import *>>> tile([1,2],1)array([1, 2])>>> tile([1,2],2)array([1, 2, 1, 2])上例中,只有一个参数,只向一个维度复制,横向的,或者说在行方向上进行复制下例有两个参数,向两个维度复制,也就是同时向行方向和列方向进行复制>>> tile([1,2],(1,1))array([[

2018-01-17 15:30:12 8418

原创 Numpy中的shape函数的用法详解

shape函数的功能是读取矩阵的长度,比如shape[0]就是读取矩阵第一维度的长度,相当于行数。它的输入参数可以是一个整数表示维度,也可以是一个矩阵。shape函数返回的是一个元组,表示数组(矩阵)的维度,例子如下:1. 数组(矩阵)只有一个维度时,shape只有shape[0],返回的是该一维数组(矩阵)中元素的个数,通俗点说就是返回列数,因为一维数组只有一行,一维情况中array创建的可

2018-01-17 14:25:05 35713

原创 机器学习实战第二章kNN代码清单2-1详细注释

# -*- coding: cp936 -*-from numpy import *import operator#创建数据集def createDataSet(): group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]]) labels=['A','A','B','B'] return gro

2018-01-16 21:02:59 658 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除