第2章 k-近邻算法【02】
实战2:在约会网站上使用k-近邻算法
一、涉及的Python函数功能介绍:
1、append() 函数的作用
在列表末尾添加新的对象
http://www.runoob.com/python/att-list-append.html
2、split()函数作用
切分数据
http://www.runoob.com/python/att-string-split.html
3、strip()函数作用
移除字符串头尾指定的字符(默认为空格)
http://www.runoob.com/python/att-string-strip.html
4、readlines()函数作用
读取所有行(直到结束符 EOF)并返回列表
http://www.runoob.com/python/file-readlines.html
5、add_subplot()函数作用
6、scatter()函数作用
http://blog.csdn.net/u013634684/article/details/49646311
7、for i in range ()作用
http://blog.csdn.net/weixin_38705903/article/details/79238226
8、min()与max()函数作用
http://blog.csdn.net/weixin_38705903/article/details/79238249
9、符号&和\作用
& 是位运算“与”
\ 是“续行”的意思
二、实际操作
1、读取数据
1)在kNN.py内新增代码
#提取datingTestSet2.txt中的数据
def file2matrix(filename):
fr = open(filename) #打开datingTestSet2.txt
arrayOLines = fr.readlines() #读取每一行的内容
numberofLines = len(arrayOLines) #记录训练集的行数(即样本数)
#定义returnMat,用于存放提取后的数据,参数3的意思是3列,因为有3个特征
returnMat = zeros((numberofLines,3))
classLabelVector = []
index = 0
#把每一行的数据依次放入line中