机器学习与统计学的区别？

最新推荐文章于 2023-08-11 02:39:08 发布

DATA-OG

最新推荐文章于 2023-08-11 02:39:08 发布

阅读量470

点赞数 1

分类专栏：数据分析文章标签：机器学习统计学

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/w19821216w/article/details/113838551

版权

数据分析专栏收录该内容

2 篇文章 0 订阅

订阅专栏

我觉得其中的一个区别是，使用场景和处理数据的理念不同。

在2015年，开始接触机器学习时，我没有只关注它的算法栈本身，更多关注的是它与统计学在使用上的区别，尤其是在处理分类与回归的问题上，两门学科都能解决，那么难免要问一问为什么他们要解决相同的问题，区别又在哪里？随着阅读大量书籍和机器学习的论文，逐渐理解了两者在处理数据理念上的不同。

在工业界中，被使用最多的一个统计学的分支是参数统计，其假设总体分布已知，需要预测的是条件均值和方差。模型选择与特征选择的指标之一是P值，但要得到准确的P值，有几个重要的假设：残差近似服从正态分布。残差的方差齐性。残差之间相互独立等条件。如果使用者不去对这些假设进行验证就直接去使用模型，而且在使用过程中又无法做AB Test，那么预测结果的使用就会很危险。

而在机器学习中，不事先假设总体的分布，也不需要对残差做任何假设（自然就没有了P值）。某些算法即存在于机器学习也存在于统计学中，甚至损失函数都相同。但是在模型选择与特征选择时，用验证集替换了P值，就是这一个小的改变，使得机器学习可以在不满足假设条件的数据上进行模型和特征的选择。当然统计学中也有很多方法去处理数据，使之尽可能的满足假设条件，但这需要许多额外的操作、较强的数理统计功底和数据处理经验。因此在数据不满足假设条件时，机器学习降低了使用者的建模难度。机器学习是统计学在应对现代复杂数据时的一个有力补充。

附上吴喜之老师的在其著作中提到的关于P值和统计显著性检验的一些看法，共大家参考。

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
机器学习与统计学的区别？

我觉得其中的一个区别是，使用场景和处理数据的理念不同。在2015年，开始接触机器学习时，我没有只关注它的算法栈本身，更多关注的是它与统计学在使用上的区别，尤其是在处理分类与回归的问题上，两门学科都能解决，那么难免要问一问为什么他们要解决相同的问题，区别又在哪里？随着阅读大量书籍和机器学习的论文，逐渐理解了两者在处理数据理念上的不同。在工业界中，被使用最多的一个统计学的分支是参数统计，其假设总体分布已知，需要预测的是条件均值和方差。模型选择与特征选择的指标之一是P值，但要得到准确的P值，有几个重要的假
复制链接

扫一扫

专栏目录

博客等级

码龄12年

2
原创

2
点赞

12
收藏

1
粉丝

关注

私信

热门文章

分类专栏

数据分析 2篇

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

python 逐步回归 step-wise regression

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。