StataIC——数据描述性统计分析、平稳性检验、平稳化

一、简介

1.本篇博文是一篇关于线性回归的基本操作;时间序列的平稳性检验、协整检验和误差修正模型(在下一篇博文里延续传送门)等的博文。

2.博主是一个普普通通的大学生,没有很厉害的技术,写的内容都是不太正经的偏小白简单的,写的也是学校教过的知识消化后自己的见解,不是很学术研究的博文。

3.配置:Window 7旗舰版+64位操作系统+StataIC 14(64-bit)

二、数据描述性统计分析

1.导入数据

(1)打开StataIC软件,在软件的上栏目中找到下图圈出的图标,那个图标就是导入数据的入口
在这里插入图片描述
(2)点进去之后,StataIC软件会新弹出另一个窗口出来给你放数据,如下图。
在这里插入图片描述
(3)一般下载到的数据都是Excel文件格式的xsl文件,是无法直接用StataIC打开的。我们可以打开Excel文件,把需要的数据选择之后复制,再打开StataIC的数据界面粘贴。

粘贴后StataIC会弹一个提示窗口,你只需按红色圈起来的那个Variable names的按钮就能把数据导入StataIC。因为有时候数据的第一行是变量名 (例:x,y,z),你就需要选Variable names;但你的x,y,z之类的变量是要作为数据的,就选择Data按钮。
在这里插入图片描述
(5)最后导入成功数据就会出现下图页面。
在这里插入图片描述

2.设置时间序列

(1)tsset是定义数据是一个时间序列数据。如果想对数据文件定义year为时间变量,则输入命令:

tsset year

若你的数据文件里的时间变量名不为year,你就需要用你的变量名去替换掉我给的命令里的year,如:

tsset ***                  #***代表你的时间变量名

(2)输入命令,命令输入的地方在StataIC软件的最先下面,输入之后Enter键即可。

在这里插入图片描述
StatarIC对输入的内容有要求,和Java一样,不能用中字输入法去输入英文字符串,不然StataIC软件会报错。

(3)时间序列设置成功就会显示如下图:

在这里插入图片描述
如果没有成功,输入栏上方就会显示红色英文句子。但一般出现短横线(如:-)即说明命令成功。

3.数据描述性统计分析

  1. 命令:sum
    在这里插入图片描述
    结果如下图所示:
    在这里插入图片描述
  2. 命令:sum 变量1 变量2,detail (更详细的描述性统计分析)
    在这里插入图片描述
    结果如下图所示:
    在这里插入图片描述

三、绘图——趋势图和散点图

1. 趋势图

  1. 命令:
line varname,title(图表名)xtitle(变量x的名称)ytitle(xxx)     #若是不需要显示名称,让括号里面为空即可                           
  1. 例:

命令:
line gdpr consr year,title(增长率)xtitle(年)ytitle()
在这里插入图片描述
绘图结果会以新的窗口形式弹出来,结果如下图显示:
在这里插入图片描述

2、散点图

  1. 第一种:

(1)命令:

twoway(scatter varname1 varname2)(lfit varname1 varname2 )      

#varname1 varname2是变量1和变量2的名称的意思
  • 其中“ lfit"表示”linear fit"(线性拟合),形状为直线。
  • 如果想在散点图上同时画出二次回归曲线,直接将“ lfit"改为“qfit",(二次拟合),形状为曲线。

(2)例一(lfit):
输入命令:twoway (scatter infla unemp) (lfit infla unemp)
在这里插入图片描述
结果如下图所示:
在这里插入图片描述

(3)例二(qfit):
输入命令:twoway (scatter infla unemp) (qfit infla unemp)
在这里插入图片描述
结果如下图所示:
在这里插入图片描述
要区别于例一,一个为lfit,一个为qfit。

  1. 第二种:

(1)命令:

aaplot varname1 varname2               #varname1 varname2是变量1和变量2的名称的意思
  • 第一步:先安装外部命令aaplot,输入命令:ssc install aaplot
  • 第二步:输入命令 aaplot varname1 varname2

(2) 例:
输入命令:aaplot infla unemp
在这里插入图片描述
结果如下图所示:
在这里插入图片描述

3.变量差分后的趋势图

  1. 命令:
line dvarname1 dvarname2 时间变量名
  1. 例:

输入命令line dinfla dunemp year:
在这里插入图片描述
结果如下图所示:
在这里插入图片描述

四、数据相关性分析

第一步:

  1. 命令:
correlate varname1 varname2                #varname1 varname2是变量1和变量2的名称的意思
  1. 1.例:
    输入命令:correlate gdpr consr
    在这里插入图片描述
    结果如下图所示:
    在这里插入图片描述

第二步:

  1. 命令:
pwcorr varname1 varname2,sig 
  1. 1例:
    输入命令pwcorr gdpr consr,sig:
    在这里插入图片描述
    结果如下图所示:
    在这里插入图片描述

五、数据平稳性分析

1.单位根检验

  1. 命令:
dfuller varname

例:

  • (1)输入命令(检验第一个变量gdpr)dfuller gdpr:
    在这里插入图片描述

  • 结果如下图所示:
    结论:gdpr不平稳
    在这里插入图片描述

  • (2)输入命令(检验第一个变量consr) dfuller consr:
    在这里插入图片描述

  • 结果如下图所示:
    结论:consr不平稳
    在这里插入图片描述

2.CF和PACF图

  1. 绘制自相关图,命令:
ac varname
  1. 绘制偏自相关图,命令:
pac varname     
  1. 例一:
    (1)输入命令ac gdpr(做gdpr的自相关图):
    在这里插入图片描述
    结果如下图所示:
    在这里插入图片描述
    (2)输入命令ac consr(做consr的自相关图):
    在这里插入图片描述
    结果如下图所示:
    在这里插入图片描述
  2. 例二
    (1)输入命令pac infla:
    在这里插入图片描述
    结果如下图所示:
    在这里插入图片描述
    (2)输入命令pac unemp:
    在这里插入图片描述
    结果如下图所示:
    在这里插入图片描述

3.若序列不平稳,生成差分变量,再做单位根检验

  1. 生成差分变量

命令:

gen dvarname1=d.varname1                        #别忘了变量名前的d
gen dvarname2=d.varname2                        #varname1 varname2是变量1和变量2的名称的意思

例:
(1) 输入命令:
gen dgdpr=d.gdpr
gen dconsr=d.consr
在这里插入图片描述
在这里插入图片描述
结果如下图所示:
在这里插入图片描述
2. 对差分后的新变量,做单位根检验:

命令:

dfuller dvarname1                #别忘了变量名前的d

例:

  1. 输入命令:dfuller dgdpr
    在这里插入图片描述
    结果如下图所示:
    结论:dgdpr平稳
    在这里插入图片描述
    输入命令:dfuller dconsr
    在这里插入图片描述
    结果如下图所示:
    结论:dconsr不平稳
    在这里插入图片描述

六、总结

  • 由于俩时间序列是非平稳的,gdpr和consr都是一阶单整的。

七、后续

  • 下一篇博文会在这篇博文的基础上写关于协整检验和误差修正模型的操作。

在这里插入图片描述
码字总结不易,点个赞吧(*・ω< )

评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值