图解机器学习

最新推荐文章于 2024-07-15 11:11:47 发布

刚是程序员

最新推荐文章于 2024-07-15 11:11:47 发布

阅读量1.8k

点赞数 1

分类专栏：数据可视化数据科学文章标签：大数据数据分析机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/github_39335046/article/details/78125720

版权

这篇博客通过图表详细介绍了机器学习中的无监督学习和监督学习。无监督学习包括降维（主成分分析PCA）和聚类（层级聚类、KMeans、DBSCAN）。监督学习则涵盖了回归（线性回归）和分类（支持向量机、决策树、逻辑回归、朴素贝叶斯、KNN）。文章通过交互图形辅助理解各种算法的工作原理。

摘要由CSDN通过智能技术生成

警告：多图杀猫！

每当提到机器学习，大家总是被其中的各种各样的算法和方法搞晕，觉得无从下手。确实，机器学习的各种套路确实不少，但是如果掌握了正确的路径和方法，其实还是有迹可循的，这里我推荐SAS的Li Hui的这篇博客，讲述了如何选择机器学习的各种方法。

另外，Scikit-learn 也提供了一幅清晰的路线图给大家选择：

其实机器学习的基本算法都很简单，下面我们就利用二维数据和交互图形来看看机器学习中的一些基本算法以及它们的原理。（另外向Bret Victor致敬，他的 Inventing on principle 深深的影响了我）

所有的代码即演示可以在我的Codepen的这个Collection中找到。

首先，机器学习最大的分支的监督学习和无监督学习，简单说数据已经打好标签的是监督学习，而数据没有标签的是无监督学习。从大的分类上看，降维和聚类被划在无监督学习，回归和分类属于监督学习。

无监督学习

如果你的数据都没有标签，你可以选择花钱请人来标注你的数据，或者使用无监督学习的方法。

首先你可以考虑是否要对数据进行降维。

降维

降维顾名思义就是把高维度的数据变成为低维度。常见的降维方法有PCA, LDA, SVD等。

主成分分析 PCA

降维里最经典的方法是主成分分析PCA，也就是找到数据的主要组成成分，抛弃掉不重要的成分。

这里我们先用鼠标随机生成8个数据点，然后绘制出表示主成分的白色直线。这根线就是二维数据降维后的主成分，蓝色的直线是数据点在新的主成分维度上的投影线，也就是垂线。主成分分析的数学意义可以看成是找到这根白色直线，使得投影的蓝色线段的长度的和为最小值。

See the Pen ML Explained PCA by gangtao (@gangtao) on CodePen.

更多PCA的相关例子，可以参考：

聚类

因为在非监督学习的环境下，数据没有标签，那么能对数据所做的最好的分析除了降维，就是把具有相同特质的数据归并在一起，也就是聚类。

层级聚类 Hierachical Cluster<

最低0.47元/天解锁文章

刚是程序员

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

刚是程序员 CSDN认证博客专家 CSDN认证企业博客

码龄7年

41: 原创

53万+: 周排名

79万+: 总排名

15万+: 访问

: 等级

1628: 积分

47: 粉丝

41: 获赞

17: 评论

179: 收藏

私信

关注

热门文章

分类专栏

数据可视化 7篇
Python 11篇
数据科学 10篇
大数据 6篇
Splunk 6篇
架构设计 14篇

最新评论

神奇的阿基米德螺线
DarkerSU: 并没有生成图片
用HTML5构建一个流程图绘制工具
Alsmile: 推荐补充一个开源的流程图、拓扑图、脑图、动画、echarts、SCADA的项目，支持（有vue和react入门教程），项目介绍：https://juejin.im/post/5d6c88726fb9a06b0e54ab35 vue开发：https://juejin.im/post/5dd73e85518825731c34b2ca react开发：https://juejin.im/post/5dcc074151882559c8061905
Spark 机器学习实践：Iris数据集的分类
AIHUBEI 回复 Burette_Lee: 请问你有这份完整的程序么？
Spark 机器学习实践：Iris数据集的分类
AIHUBEI 回复 Burette_Lee: 你好，请问你有这个完整的程序么？
Spark 机器学习实践：Iris数据集的分类
AIHUBEI 回复 Burette_Lee: 你好，请问你有没有完整的程序啊？上面这个我跑着有问题，

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。