8种用Python实现线性回归的方法，究竟哪个方法最高效？

大数据文摘

于 2018-01-08 00:00:00 发布

阅读量9k

点赞数 3

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dzJx2EOtaA24Adr/article/details/79013866

版权

本文介绍了8种使用Python实现线性回归的方法，包括Scipy和NumPy的函数、Statsmodels的OLS、以及矩阵求逆等。通过比较不同方法在大数据集上的运行速度，发现即使是简单的矩阵逆求解方法，如stats.linregress和矩阵乘法求逆，也能在处理大量数据时表现出较高的效率。此外，文章强调了线性回归在易解释性和灵活性方面的价值，尤其是在物理学和经济学等领域。

摘要由CSDN通过智能技术生成

大数据文摘作品

作者：TirthajyotiSarkar

编译：丁慧、katherine Hou、钱天培

说到如何用Python执行线性回归，大部分人会立刻想到用sklearn的linear_model，但事实是，Python至少有8种执行线性回归的方法，sklearn并不是最高效的。

今天，让我们来谈谈线性回归。没错，作为数据科学界元老级的模型，线性回归几乎是所有数据科学家的入门必修课。抛开涉及大量数统的模型分析和检验不说，你真的就能熟练应用线性回归了么？未必！

在这篇文章中，文摘菌将介绍8种用Python实现线性回归的方法。了解了这8种方法，就能够根据不同需求，灵活选取最为高效的方法实现线性回归。

“宝刀不老”的线性回归

时至今日，深度学习早已成为数据科学的新宠。即便往前推10年，SVM、boosting等算法也能在准确率上完爆线性回归。

为什么我们还需要线性回归呢？

一方面，线性回归所能够模拟的关系其实远不止线性关系。线性回归中的“线性”指的是系数的线性，而通过对特征的非线性变换，以及广义线性模型的推广，输出和特征之间的函数关系可以是高度非线性的。另一方面，也是更为重要的一点，线性模型的易解释性使得它在物理学、经济学、商学等领域中占据了难以取代的地位。

那么，如何用Python来实现线性回归呢？

由于机器学习库scikit-learn的广泛流行，常用的方法是从该库中调用linear_model来拟合数据。虽然这可以提供机器学习的其他流水线特征（例如：数据归一化，模型系数正则化，将线性模型传递到另一个下游模型）的其他优点，但是当一个数据分析师需要快速而简便地确定回归系数（和一些基本相关统计量）时，这通常不是最快速简便的方法。

下面，我将介绍一些更快更简洁的方法，但是它们所提供信息量和建模的灵活性不尽相同。

各种线性回归方法的完整源码都可以在文末的GitHub链接中找到。他们大多数都依赖于SciPy包。

SciPy是基于Python的Numpy扩展构建的数学算法和函数的集合。通过为用户提供便于操作和可视化数据的高级命令和类，为交互式Python会话增加了强大的功能。

8种方法实现线性回归

最低0.47元/天解锁文章

大数据文摘

关注

3
点赞
踩
40

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。