【机器学习】机器学习从零到掌握之三 -- 教你使用K近邻算法改进约会网站

本文是《机器学习从零到掌握》系列之第3篇

机器学习从零到掌握之一 -- 教你理解K近邻算法

机器学习从零到掌握之二 -- 教你实现K近邻算法

本篇使用的数据存放在文本文件datingTestSet2.txt中,每个样本数据占据一行,总共有1000行。

样本主要包含以下3中特征:

(1)每年获得飞行常客里程数

(2)玩视频游戏所耗时间百分比

(3)每周消费的冰淇淋公升数

在使用分类器之前,需要将处理的文件格式转换为分类器所接受的格式。


下边代码用来处理输入格式问题:该函数的输入为文件名字符串,输出为训练赝本矩阵和类标签向量。该函数可以作为格式处理函数,在具体例子中稍加改动即可。

代码里已经有详细的注释说明,如有不懂可以留言一起交流。

file2matrix.py


                
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值