【数模笔记07】多元线性分析-回归分析基础

Jilly_llll

已于 2024-07-30 10:32:51 修改

阅读量315

点赞数 3

分类专栏：数模笔记——啊听说你也在学数模嘛文章标签：笔记回归数据挖掘

于 2024-07-24 22:20:21 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_79843311/article/details/140673924

版权

数模笔记——啊听说你也在学数模嘛专栏收录该内容

7 篇文章 0 订阅

订阅专栏

------------------------------------------------------------------------------------------基于清风数模网课整理

目录

一、回归分析是什么？

二、回归分析究竟要去解决什么呢？

一、回归分析是什么？

【理解】

（1）相关性：与因果性不同。例如，天气热的时候，空调费用花费多；夏天时候，雪糕销售量也多，按道理，若计算两者，能有“雪糕卖的越多，空调费用越高”，显然这是不合理的。绝大部分时候，我们是不能直接分析严格的因果关系，只能去通过回归分析来研究相关性。

（2）Y：因变量（被解释变量），在研究时候，是核心的研究变量。对应着五种的回归分析，有五种变量类型：

（a）连续性数值变量：例如GDP增长率

(b）0-1型变量：例如某公司研究借款人是否按时还款，Y=0为不还款，Y=1是还款

(c）定序变量：例如设计问卷来询问消费者的满意程度，1为非常满意，2为满意，3为一般，4为有点不满意，5为非常不满意

(d）计数变量：例如管理学历RFM模型，F代表一定时间内客户到访次数，易知改次数是非负整数

(e）生存变量：研究产品寿命、企业寿命甚至于人的寿命。比如，现在我们要观测运动对于人寿命的影响，老王现年65岁，平常基本无运动习惯，但研究时又不可能一直等到他趋势再研究该样本。所以，直接将数据记录为60+，这中数据是截断的。

（3）X：自变量（解释变量）

【分类】

二、回归分析究竟要去解决什么呢？

1、哪些X是和Y真正相关的，那些不是。也就是选择出真正重要的变量。

2、所有这些有用的X变量和Y的相关性是正的呢还是负的呢？

3、在确定了重要的X变量的前提下，还要赋予不同的X不同的权重（即不同的回归系数），分析不同变量之间的相对重要性。

三、数据

【数据分类】

1、横截面数据：在同一个时间节点获得的数据

例如：全国各个省份2018年降水总量

2、时间序列数据

例如：中国历年GDP数据；某地每个小时的温度湿度数据

3、面板数据：综合横截面数据和时间序列数据

例如：2008年到2018年，我国各个省份的GDP数据

【不同数据处理方法】

【数据获取】各类网站数据，python爬虫（留个坑......）

（补本书：《中级计量经济学》）

四、一元线性回归

总结

关注

3
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
【数模笔记07】多元线性分析-回归分析基础

目录一、回归分析是什么？二、回归分析究竟要去解决什么呢？三、数据总结一、回归分析是什么？【理解】（1）相关性：与因果性不同。例如，天气热的时候，空调费用花费多；夏天时候，雪糕销售量也多，按道理，若计算两者，能有“雪糕卖的越多，空调费用越高”，显然这是不合理的。绝大部分时候，我们是不能直接分析严格的因果关系，只能去通过回归分析来研究相关性。（2）Y：因变量（被解释变量），在研究时候，是核心的研究变量。对应着五种的回归分析，有五种变量类型：（a）连续性数值变量：例如GDP增长率 (b）
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。