如何用STATA快速完成一篇毕业论文的实证部分【第一部】

这个教程主要是要教大家如何使用 Stata 软件来完成一个实证类的文章,这个教程比较适合第一次使用,如果我说是已经有经验的,就不用再看这个文章了,因为这个文章主要教的是一些最基本的操作,这些操作和命令其实大家也可以自己去百度,网上都有,但是为了避免大家像我一样一边做一边去搜,特别麻烦,所以我就做了这个教程。大家可以准备好你的数据,跟着我一步一步的做就可以了。 我们这个教程的思路主要是和大家学论文的思路是一致的,大家比如说什么金融专业、财会专业,还有其他专业,有时候可能需要写一些时政类的文章,去研究 a 对 b 的影响,或者是 a b 对 seed 影响,这样这个时候就需要用到一些计量软件,比如说stata、spss、 eviews 这些。那我们学校主要是要求使用Stata,所以我这个地方就用 Stata 作为例子。

相比来说的话, SPSS 的使用会比较简单一点,因为 SPSS 它是窗口化的操作,就是你只用点击就可以,不用自己去输入命令。 大家去看一些硕士论文、博士论文或者是期刊的话,都会发现这个实证类的文章,它的时政分析部分主要有四个,就是有四个步骤,第一个就是描述性统计,然后第二个是相关性分析,然后第三个也是最重要的回归分析。那这个部分其实有很多种的回归方法,比如说线性回归,那个 logistic 还有领回归有很多,我们这个教程主要是涉及最简单的多元线性回归,因为我这个教程主要是以我自己的论文为例,所以这个就是在这个部分,我的论文还包括就是滞后效应和调节效应的一些模型。但是我们在这个教程先不涉及这些,就只涉及一个最简单的线性多元回归就完了。 然后第四个部分就是敏捷性检验,那我们这个教程主要也是教大家如何使用 stata软件来进行这些步骤,而并且如何而直接的从 stata软件中将这些结果导出。好,因为我这个我的研究主要它用的是一个面板数据,那我们先来看一下这个面板数据它应该是什么样子的?大家可以看到这是一个 57 家企业在六年里的一个数据,它的第一行是我们的变量名称,然后这个 code 就是只对个体的编码,第一就代表是第一家企业,然后后面跟的就这后面跟的就是他这六年的一个数据,然后下面依次是第二家企业在 6 年的数据,然后第三家、第四家这样依次排列下来。 我们一般在 window 上下载的数据,它是一个截面的数据,所以我们就需要手动的将这个截面数据转换为面板数据。如果说你觉得这个很困难,做不了的话,你可以私信我,我可以教你,或者说我再做一个教程,教大家怎么比较便捷的将这个截面数据转化为面板数据。

 

 

好,我们现在就可以打开我们的 Stata 进行操作了,我的电脑上主要是有 Stata 15 和12,其实它们在操作上并没有非常大的区,它们不同的地方就在于 Stata 14 之前它是不能够识别中文的,所以如果你用的是 1213 或者是更加古早的版本的话,就需要你在你的那个数据的变量名称中千万不要有汉字,因为它是识别不了的,所以你要把它改成英文。我们这个地方还是用 15 块进行演示,当然你用就是 1213 也是可以,就是还有 14 也都是可以跟着我来做的。 首先第一步是要打开我们的数据,点击 file import excel brows,将它导入到 Stata 中。这个 import Festival with arrival names 这个地方是需要打勾的,这样 data 就可以自动地将你的这个第一行当做是我们变量的名称。okay,然后我们需要告诉Statup,这是一个面板,数据输入 x t set, cold there,然后这个时候 stata就会知道你这是一个平衡面板,然后包括了 13 年到 18 年六年的数据,就是一些特别简单的操作。我这个地方就做展示,我们要做的主要是在我们论文上需要呈现的结果。 好,那第一步就是描述性统计,因为我打字比较慢,所以我就已经把这个命令都已经复制好了,就是我是复制过去的,你们也可以直接复制这个命令,然后我可以我会告诉你,就是你复制过去之后哪些地方是需要你手动的去改动的。好,那我们先把这第一条指过去,大家可以看一下这个地方,你是可以改的,这个叉是代表你需要,就是你要导入的这个 word 的名称,你可以随便改,如果你不改的话,那个 word 图叫做叉。然后这个命令别的地方是不需要改动的,它的意思就是说它要对你的所有的变量做一个描述性统计。 大家注意一下这个 out rag 这个r, outer rag r 这个命令它不是 status 自带的,它是需要下载的,所以这个床垫要输入SSC, in store, out RAG r,然后去进行下载,因为我是已经有这个命令了,所以我就不再次下载了。 如果你在下载的过程中出现了 R109 这个错误的话,那说明你的这个 Stata 连不上网,那连不上网它可能是因为你的这个 Stata 它不是正版,当然也还有很多其它的原因,这个时候就需要你自己去解决一下。好,那我们依然进行刚刚的操作。嗯,回车,然后我们就可以点击这个叉,点 doc 这个蓝色的地方,点它一下,就会发现我们的这个结果已经导入到了一个 word 中。好,这个代表所有的统,所有的变量的统计量。这个时候我是建议你的就是新建一个word,然后把每次的结果都把它就是复制到那边去。

为什么呢?因为我们这个 word 它是在不断的replaced,所以你每做一次它这个 word 就同一个文件的结果都会不一样,当然你也可以就是命名成不同的文件也可以,但是如果你不改变这个文件的名称的话,它就会就是这个文件中它的结尾会一直的改变。所以我建议大家把你的这个结果粘贴到另外一个文件中去,并且把每次的结果都粘贴到那个文件中去,就方便你之后的整理好,然后把它关掉。 假如说你不想对所有的变量去做一个描述性统计,你只想针对其中的某几个变量去做的话,我们就用下面这个。好,那这个地方我们需要改动的是什么呢?就是这个地方,大家看这个括号里面就代表你需要对哪些变量去做这个要复兴统计,那以我这个为例的话,那假设我们是需要对这个SUB,sides,依然是要点击这个叉,点doc,我们就可以看到它显示出了我们所选的这些变量的一些统计量。好,依然是记得把这个结果复制到另外一个 one 中去。好,有时候我们会想,就是以一个标准将这些变量分组,然后分组进行统计。就比如说我的这个研究,他需要关心国有企业和那个民营企业之间的一些区别,所以我就需要针对他这个所有制来进行分组进行描述性统计。那我们需要用这样一条命令, challenge the biosort 依然是复制过来,这个 x 就代表了你需要作为依据去进行分组的那个变量,那我们这个地方使用的是Pro,就是它的产权跟所有制依然是点火车,我们再点开这个doc,好,可以看到这个地方它根据你的所有质的不同进行了分组的描述。 这个 Pro 0 代表是0, Pro e 代表是国有企业,就如果你需要做这个的话,你可以用这样me,好,那就是论文中所需要的描述性统计的部分,就到这里。然后下一个就是相关性分析。我们在做这个的时候需要下载一个命令,叫做logout,就是这个命令大家也是需要回车把它下载下来,因为我是已经有了,所以我就不再下载了。

 

好,今天就分享到这里,明天继续写第二部分实证教程,希望赶快与大家见面,写的不好的地方也请海涵或指点。

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

开心数据

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值