阿白的机器学习实战笔记1
python零基础,啥都不懂的小白,一句句翻译中。。。
//准备训练数据集
//包含数据的坐标位置,与数据的标签
def reacteDataSet():
	group = array{[[1.0,1.1],
			[1.0,1.0],
			[0.0],
			[0,0.1]]}
	lables = ['A','A','B','B']
	return group,lables


def classfy0(inx, dataSet,lables,k):
	dataSetSize = dataSet.shape[0]//获取数据集的行数
	diffMat = tile(int,(dataSetSize,1))-dataSet; //将待测数据在行方向扩展datasize次,再减去原来的矩阵,得到差矩阵;
	sqDiffMat = diffMat**2
	sqDistance = sqDiffMat.sum(axis=1)//矩阵的每一行向量相加 即是把每一行的所有数据相加   axis=0按列相加  即是把该列所有数据相加
	distance =sqDistance**0.5
	sortDistIndicies = distance.argsort()//将distance中的元素从小到大排列,提取其对应的index(索引),然后输出到sortDisdIndiccies,它也是个数组
	classCount={}
	for i in range(k)
		voteIlabel = lables[sortDistIndicies[i]]   
		classCount[voteIlabel] = classCount.get(voteIlabel,0) +1  
get(key,default=None)造字典
 //依次查询是否有该key,有则将取出value再+1,没有则返回添加该key并置value为0,再+1
sortedClassCount = sorted(classCount.iteritems(), //sortedClassCount是一个listkey = operator.itemgetter(1),reverse = True)return sortedClassCount[0][0]
阅读更多
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

不良信息举报

阿白的机器学习实战笔记1

最多只允许输入30个字

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭