【Stata】Stata做实证分析的预处理阶段

一、前言

计量经济学是绕不过去的坎,但是在校期间的课程很多都是以晦涩的理论作为讲解,然而对于完成一篇课程论文而言,理论基础固然重要,但并不是必须,如果从走捷径的角度而言,完成一篇论文的实证部分并不需要你从头到尾把理论知识弄懂,仅需要以下三个步骤即可:

(1)下载软件、下载论文所需数据

(2)照葫芦画瓢完成软件操作(不需要懂为什么,只要按照步骤把结果做出来就行)

(3)对于所得结果进行分析(有模板参考)

二、下载Stata

这一步相信大家都已经完成,后面出一期详细的教程来讲解!

三、下载所需数据

经管类的数据一般在国泰安数据库下载,先挂学校vpn,然后直接搜索国泰安可找到,进入过后选择数据中心——单表查询(跨表查询需要个人账户,一般用单表查询后用excel进行数据合并),然后选择右上角的搜索框,输入想要查询的数据即可。
在这里插入图片描述

多下载几年的数据,比如10年,这样后续处理过程如果样本量太少,不用重复下载。输出类型一般默认为excel2007。

如果学校没有购买该数据库或者查不到自己要的数据,此时可以通过闲鱼代查,淘宝购买某某图书馆账号等,也很方便不再赘述。

三、Stata基础操作

3.1 导入数据

3.1.1 直接复制粘贴(推荐)

将下载好的数据保存在Excel中,然后直接复制粘贴到stata中,但是要注意将第一行作为变量名。

3.1.2 直接导入xls文件

拖拽进去即可!

3.2 处理数据

导入数据后,需要进行一些初步的处理,包括更改变量名,生成一些新字段,删除重复数据,合并数据等。这里学长介绍一些常用的数据处理方式。

3.2.1 异常值处理

3.2.1.1 直接删除

这是一种非常粗暴的方法。由于异常值对于统计推断的影响巨大,因此如果数据量样本足够大而异常值并不多的情况下,可以考虑直接删掉异常值

3.2.1.2 winsorize命令

winsorize是用相应分位数的值替代分位数之外的值,而不是删掉,这样可以最大限度的保存数据信息。Stata里有现成的winsorize程序,打开Stata,在命令行输入ssc install winsor2,replace,自动安装 winsor2。安装完之后,winsor2命令的基本格式为:

winsor2 变量名 变量名, replace cuts(1 99)

3.2.2 数值显示红色的处理

若发现某个指标的数据显示为红色,需要更改该指标的数据类型。红色代表字符串,若要转成数值型,可以试试destring命令。

四、常见命令含义

help 帮助

clear 清空内存数据

use 打开STATA格式的数据文件

save 保存内存中的数据

input 录入数据

edit 编辑数据

merge 将两个数据文件横向拼接

generate 生成新的数据

rename 变量重命令

drop 删除变量或观察值

sort 对观察值按从小到大顺序重新排列

describe 总体展示数据情况

list 列示内存中的数据

count 报告共有多少观察值

table 数据列表

tabulate 联列表

display 显示计算结果

log 将输出结果存放入结果文件

具体细节可以看其他书籍!

在这里插入图片描述

  • 6
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

旅途中的宽~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值