数据分析步骤

1、提出问题

解决的问题是什么

2、获取数据

3、数据预处理

3.1 数据查看和探索

通过一些图标查看数据的情况,包括数据分布,数据的缺失值情况,最大最小值等

3.2 数据清洗

缺失值替换,异常值删除等

3.3 特征工程

特征选择
特征的离散化,归一化
数据降维等

分组替换等,探索进行绘图,最大值最小值查看等,数据之间的相关性数据探索也是为了特征的提取和处理
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4、数据建模分析

建模

5、结果展示(可视化,报告)

图表,报告等

【1】这几步:https://blog.csdn.net/DataCastle/article/details/77865531?utm_medium=distribute.pc_relevant.none-task-blog-2defaultbaidujs_title~default-0.control&spm=1001.2101.3001.4242

【2】这个比较全面
https://blog.csdn.net/u013480893/article/details/90195725?utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EOPENSEARCH%7Edefault-5.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EOPENSEARCH%7Edefault-5.control
【3】大案例了解数据分析的步骤
https://zhuanlan.zhihu.com/p/136819457

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
⾯板数据分析步骤 ⾯板数据分析步骤 ⾯板数据分析步骤 阅读笔记, 阅读原⽂请点链接: 1. 单位根检验 单位根检验 分析数据的平稳性,避免出现虚假回归或伪回归。 李⼦奈认为平稳的真正含义是:⼀个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同⽅差,即⽩噪 声。因此单位根检验时有三种检验模式:既有趋势⼜有截距、只有截距、以上都⽆。 对⾯板数据绘制时序图,粗略观测时序图中是否含有趋势项和(或)截距项; 检验单位根的⽅法: LLC法:该⽅法允许不同截距和时间趋势,异⽅差和⾼阶序列相关,适合于中等维度(时间序列介于25~250 之间,截⾯数介于10~ 250 之间) 的⾯板单位根检验。 IPS法 Breitung法 ADF-Fisher PP-Fisher 有时为了⽅便,只采⽤两种⾯板数据单位根检验⽅法,即相同单位根检验LLC,和不同单位根检验Fisher-ADF检验。 存在单位根的解决⽅法:使⽤⼀阶差分或⼆阶差分及⾼阶差分,直⾄序列平稳为⽌。 2. 协整及调整模型 协整及调整模型 情况⼀:如果基于单位根检验的结果发现变量之间是同阶单整的,那么我们可以进⾏协整检验。 情况⼆:如果如果基于单位根检验的结果发现变量之间是⾮同阶单整的,即⾯板数据中有些序列平稳⽽有些序列不平稳,此时不能进⾏协整 检验与直接对原序列进⾏回归。此时应该对模型进⾏修正,消除数据不平稳对回归造成的不利影响。 3. 进⾏回归 进⾏回归 混合估计模型:如果从时间上看,不同个体之间不存在显著性差异;从截⾯上看,不同截⾯之间也不存在显著性差异,那么就可以直接 把⾯板数据混合在⼀起⽤普通最⼩⼆乘法(OLS)估计参数。 固定效应模型:如果对于不同的截⾯或不同的时间序列,模型的截距不同,则可以采⽤在模型中添加虚拟变量的⽅法估计回归参数。 随机效应模型:如果固定效应模型中的截距项包括了截⾯随机误差项和时间随机误差项的平均效应,并且这两个随机误差项都服从正态 分布,则固定效应模型就变成了随机效应模型。 模型的选择:我们经常采⽤F检验决定选⽤混合模型还是固定效应模型,然后⽤Hausman检验确定应该建⽴随机效应模型还是固定效 应模型。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

晓码bigdata

如果文章给您带来帮助,感谢打赏

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值