《机器学习实战》学习笔记——K-近邻算法(KNN)(二)海伦约会网站匹配实战

《机器学习实战》中KNN算法实例一:关于这个实战的故事背景可以搜索“海伦 约会网站”基本上就可以了解。
这个实验的目的是根据已有的海伦整理出来的约会对象的资料和海伦对约会对象的评价,构造分类器,使对新的约会对象进行自动分类(不喜欢的人,魅力一般的人,极具魅力的人)。

数据准备

海伦准备的约会数据datingTestSet.txt,我已上传github
我们可以先看一下截图:
这里写图片描述
文件一共有四列,每一行为一个约会对象的信息(“每年获得的飞行常客里程数”,“玩视频游戏所消耗的时间百分比”,“每周消费的冰激凌公斤数”),最后一列是海伦对他的评价。
那么得到数据后,我们从下面几个方面来处理数据,帮助海伦来预测约会对象是否合适:
1.先将文本的数据文件转换为NumPy的解析程序
2.分析数据,将数据可视化
3.准备数据:归一化数值
4.测试分类器,计算准确率
5.使用算法,对新的约会对象进行预测

将文本的数据文件转换为NumPy的解析程序

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值