《机器学习实战》学习笔记——K-近邻算法（KNN）(二)海伦约会网站匹配实战

最新推荐文章于 2021-10-10 20:01:58 发布

邵露露

最新推荐文章于 2021-10-10 20:01:58 发布

阅读量1.7k

点赞数 1

分类专栏： python 机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38605247/article/details/78829252

版权

本文是《机器学习实战》中KNN算法的应用，通过海伦约会网站的数据，构建分类器对约会对象进行自动分类。数据包括飞行常客里程数、视频游戏时间百分比和每周冰激凌消费量，目标是预测海伦对约会对象的评价。文章涉及数据准备、文本转NumPy、数据可视化等步骤。

摘要由CSDN通过智能技术生成

《机器学习实战》中KNN算法实例一：关于这个实战的故事背景可以搜索“海伦约会网站”基本上就可以了解。
这个实验的目的是根据已有的海伦整理出来的约会对象的资料和海伦对约会对象的评价，构造分类器，使对新的约会对象进行自动分类（不喜欢的人，魅力一般的人，极具魅力的人）。

数据准备

海伦准备的约会数据datingTestSet.txt，我已上传github
我们可以先看一下截图：
这里写图片描述
文件一共有四列，每一行为一个约会对象的信息（“每年获得的飞行常客里程数”，“玩视频游戏所消耗的时间百分比”，“每周消费的冰激凌公斤数”），最后一列是海伦对他的评价。
那么得到数据后，我们从下面几个方面来处理数据，帮助海伦来预测约会对象是否合适：
1.先将文本的数据文件转换为NumPy的解析程序
2.分析数据，将数据可视化
3.准备数据：归一化数值
4.测试分类器，计算准确率
5.使用算法，对新的约会对象进行预测

将文本的数据文件转换为NumPy的解析程序

最低0.47元/天解锁文章

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。