【机器学习实战笔记】第2章 k-近邻算法【02】

本文详细介绍了如何在约会网站上应用k-近邻算法,包括Python函数的使用、数据读取与分析、数据归一化、算法测试与系统构建,并列举并解决了在实战过程中遇到的常见错误。
摘要由CSDN通过智能技术生成

第2章 k-近邻算法【02】

实战2:在约会网站上使用k-近邻算法

一、涉及的Python函数功能介绍:
1、append() 函数的作用

在列表末尾添加新的对象
http://www.runoob.com/python/att-list-append.html

2、split()函数作用

切分数据
http://www.runoob.com/python/att-string-split.html

3、strip()函数作用

移除字符串头尾指定的字符(默认为空格)
http://www.runoob.com/python/att-string-strip.html

4、readlines()函数作用

读取所有行(直到结束符 EOF)并返回列表
http://www.runoob.com/python/file-readlines.html

5、add_subplot()函数作用

定义图片的位置
http://www.codeweblog.com/matplotlib-pyplot%E4%B8%ADadd_subplot%E6%96%B9%E6%B3%95%E5%8F%82%E6%95%B0111%E7%9A%84%E5%90%AB%E4%B9%89/

6、scatter()函数作用

http://blog.csdn.net/u013634684/article/details/49646311

7、for i in range ()作用

http://blog.csdn.net/weixin_38705903/article/details/79238226

8、min()与max()函数作用

http://blog.csdn.net/weixin_38705903/article/details/79238249

9、符号&和\作用

& 是位运算“与”
\ 是“续行”的意思

二、实际操作
1、读取数据

1)在kNN.py内新增代码

#提取datingTestSet2.txt中的数据
def file2matrix(filename):
    fr = open(filename) #打开datingTestSet2.txt
    arrayOLines = fr.readlines()    #读取每一行的内容
    numberofLines = len(arrayOLines)    #记录训练集的行数(即样本数)
    #定义returnMat,用于存放提取后的数据,参数3的意思是3列,因为有3个特征
    returnMat = zeros((numberofLines,3))

    classLabelVector = []
    index = 0

    #把每一行的数据依次放入line中
    
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值