如何用线性回归模型做数据分析?

本文介绍了线性回归的基本概念、应用场景,如驱动力分析和预测,并通过实例详细阐述了线性回归模型的建立过程,包括线性系数计算、决定系数R方与调整R方的解释。此外,还提供了线性回归在实际数据分析中的实战流程,包括数据预处理、模型构建和结果解读。
摘要由CSDN通过智能技术生成

小洛写在前面:

很多同学目前所做的业务分析工作,徒手分析即可cover业务需求,较少用到一些高阶的统计模型和机器学习上面的东西。渐渐的便会产生一种感觉,即数据分析满足业务需求即可,不需要会机器学习。

但我认为

 1、目前的工作不需要,不代表之后的工作不需要,我们应该着眼于我们整个数据分析生涯 ;

2、掌握一些模型可以高效做一些定量分析,较徒手分析效率更高,更准 ;

3、我们觉得一些东西没用,很可能是因为我们还没有发现如何去用 ;

4、我们对自己的要求不应该止于满足业务需求,一些探索性专题非常依赖于机器学习 ;

基于以上,我尝试开始更新一些机器学习方面的文章,从较基础的线性回归、决策树等开始,希望大家可以跟着小洛一起学习,有疑问大家可以随时在交流群提~


一、什么是线性回归

线性回归是利用线性的方法,模拟因变量与一个或多个自变量之间的关系。对于模型而言,自变量是输入值,因变量是模型基于自变量的输出值,适用于x和y满足线性关系的数据类型的应用场景。

线性回归应用于数据分析的场景主要有两种:

  • 驱动力分析:某个因变量指标受多个因素所影响,分析不同因素对因变量驱动力的强弱(驱动力指相关性,不是因果性);

  • 预测:自变量与因变量呈线性关系的预测;

模型数学形式:????=????0+????1????1+????2????2+⋯+????????????????

 

例如要衡量不同的用户特征对满意分数的影响程度,转换成线性模型的结果可能就是:分数=-2.1+0.56*年龄

 

线性回归模型分为一元线性回归与多元线性回归:区别在于自变量的个数

二、线性系数的计算-最小二乘法

我们知道了模型的公式,那么模型的系数是如何得来呢?我们用最小二乘法来确定模型的系数。最小二乘法,它通过最小化误差的平方和寻找数据的最佳函数匹配,利用最小二乘法可以求得一条直线,并且使得拟合数据与实

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值