自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Stata连享会

连玉君老师团队 - 主页 lianxh.cn

  • 博客(1034)
  • 资源 (2)
  • 收藏
  • 关注

转载 Stata数据处理:一些技巧和建议

你面对一个数据集的时候,你的第一目标便是理解这一个数据集,然后尝试去清洗它。从逻辑上讲,这是两个独立的过程,但是在实际操作的过程中,这两步往往是相互交错的。在没有完全理解之前是不可能清洗干净数据的,同样在清洗干净数据之前你也无法完全理解这份数据。

2024-09-24 09:00:13

转载 Stata绘图:为图形选择优美的配色方案-color_style

一图胜千言!数据可视化已成为经济学研究中必不可少的一步,而其中最容易出错的可能是色彩的选择。Stata 默认的配色方案并不是很完美,这也意味着我们需要为图形选择合适的配色方案。 可以快速帮您更换图形配色,让您的研究绽放光彩!

2024-09-23 22:34:43 14

转载 CiteSpace:文献分析软件介绍

CiteSpace 软件是 Citation Space 的简称,译为“引文空间”,是由美国德雷赛尔大学计算机与情报学教授陈超美博士基于 Java 语言开发、基于引文分析理论的信息可视化软件。该软件可呈现科学知识的结构、规律和分布情况,分析出来的图形称为“科学知识图谱”,主要用于综述类论文写作,理论观点、演化路径、发展趋势、学术史等梳理,学术研究领域热点扫描等方面,是一款定量分析的实用型文献分析软件。

2024-09-23 14:30:00 1

转载 Stata:计算文本语调-onetext

文本分析是指对文本特征项的选取过程,是 Natural Language Processing (NLP) 的一个重要环节。在现实生活当中,有很多重要的数据都是以文本形式存在,为广义上的非结构化的数据。例如,年报中管理层讨论与分析部分的文字、工作报告中的文字等。从已有发表来看,主流的期刊杂志中仍缺少对文本信息的觉察与测量,且测量方法在过去的十年内所呈现出的形式都较为单一化。

2024-09-23 09:30:00 2

转载 工具变量:与朱熹书院距离作为IV

作者采用随机推理方法构建了朱熹书院的反事实空间配置。比较了与反事实书院的距离和与现实书院的距离对宗族实力和银行发展的影响。结果表明,与实际朱熹书院的距离相比,与反事实朱熹书院的距离对宗族空间分布的预测能力要弱得多。因此,距离工具变量不太可能通过儒家家族以外的渠道影响金融发展。

2024-09-23 08:45:00 2

转载 Stata:展示OLS和GLM的交乘项(一)-icalc

本文主要介绍 Stata 中用以帮助解释广义线性模型交互作用的icalc命令包。该命令由 Temple University 名誉教授 Robert Kaufman 编写。它是一个由五个命令组成的工具包,用于帮助解释和报告广义线性模型中的交互效应。net install icalc.pkg, from("D:/Stata17/icalc") replace // 更换地址// 或者: https://econpapers.repec.org/software/bocbocode/s459052.htm。

2024-09-23 08:15:00 2

转载 Zotero:常用功能梳理

阅读全文:Zotero:常用功能梳理 (lianxh.cn)在研究期间,看文献、做笔记是你需要经常做的事情,倘若没有对文献进行很好地归类与处理,当你再次寻找上次的文献时,便会抓耳挠腮,苦苦寻求而不得。工欲善其事必先利其器,掌握一个文献管理软件就会让你在研究期间省去很多不必要的时间与成本。在各类文献管理软件中,都各有其特点。比如 NoteExpess 对中文文献比较友好,Endnote 处理英文文献相对方便。那么会不会存在一个既有利于中文文献,又有利于英文文献阅读的软件呢?

2024-09-22 20:00:00 25

转载 Stata:异常值检测算法-分离森林-iforest

iforest是 isolation forest (分离森林) 的简称,适用于连续数据的异常检测。其中,异常检测又称“离群点检测”,是机器学习领域里应用较为广泛的一类问题。“异常”在这里指“容易被孤立的点”,即分布稀疏且距离高密度的点比较远的数据。异常数据跟样本中大多数数据不太一样;异常数据在整体数据中占比较小。一般的异常检测方法主要是通过对正常样本的描述,给出一个正常样本在特征空间中的区域,对于不在这个区域中的样本,视为异常。

2024-09-22 15:54:28 35

转载 Stata:线性与对数线性函数形式选择-imfreg

在利用 Stata 进行 OLS 回归分析时,模型设定常常有水平—水平、水平—对数、对数—水平、对数—对数四种形式。其中在对数形式的函数设定中,回归系数有弹性与半弹性的经济学含义。在实证研究中,研究者经常苦恼于如何选择合适的函数形式。对于非嵌套模型,我们常常采用 RESET 检验以及比较调整 R-Squared 的方法来选择模型;而对于嵌套模型,我们常常利用 F 检验来进行模型选择。本文将结合lmfreg。

2024-09-22 13:52:29 107

转载 论文复现:装模做样的IV

针对可能存在的问题,本文提出四种补救措施,以帮助研究人员克服这些困难:第一,在构建工具变量回归的理论基础时,应当考虑使用同一工具变量的其他已发表结果。第二,使用最新的方法来检验工具变量违反排除限制的敏感性。第三,用补充的方法来评估工具变量强度,打开 GMM 的“黑箱”。第四,使用弱工具稳健检验和估计量。

2024-09-22 10:17:54 22

转载 xtusreg:时间间隔不等情况下的动态面板估计

估计固定效应动态面板回归模型的传统命令xtabond要求模型的时间间隔必须是三个连续的时间段或两对两个连续的时间段。但是现实研究中有许多数据的观测都不满足上述要求,所以我们需要借助不规则时间间隔的面板数据估计方法来实现更多动态面板回归模型的参数估计。本推文将要介绍的新命令xtusreg我们考虑如下模型:其中,yityit​ 和 xitxit​ 分别为被解释变量和解释变量,αiαi​ 表示个体固定效应,εitεit​ 为随机干扰项。

2024-09-22 10:08:00 48

转载 Stata:一组大幅提升运算速度的命令-gtools

对于大部分 Stata 用户来说,相对小量、简单的数据统计或数据处理乃日常上机必走的工序,对 Stata 的运行效率并没有什么感知。然而,当数据集异常庞大时,你不得不对着运行界面发愣,而旁边的人由于用上。可以查看命令组中所包含的主要命令。的速度最高可达 Stata 传统命令的近 20 倍,可以说是当之无愧的效率达人!命令组早早看到了输出结果,这种“知觉”将立马苏醒!

2024-09-21 21:35:11 27

转载 Stata中的各种函数一览

在最开始,首先需要明悉 Stata 函数的定义和基本性质。数学:函数 ff 是一种特殊的二元关系,满足在特定规则下,对于输入值集合中的 ∀x∀x ,皆有且仅有一个输出值集合中的 yy 与之对应;计算机科学:函数是一种子程序,作为大型程序中的某部分代码有输入参数及返回值,负责完成某项特定任务且具备相对的独立性。Stata 作为一种数据导向的编程语言,对于函数的定义更贴近于计算机科学:接受用户提供的 n 个参数 (此处的 n 可以为 0),并根据定义函数的规则对参数进行计算,返回单个结果的代码块。

2024-09-21 09:45:00 7

转载 多变量排序问题:以中国工业企业数据库为例

在对变量名称规整后,将具有研究价值的变量进行排序,这样不仅使得数据的条理性更为清晰,而且会减小内存占用,提高数据处理的效率。类似中国工业企业数据库这样连续年份的多期数据还有很多,如《全国地市县财政统计资料》,《中国城市统计年鉴》等,大部分多期的数据资料都存在着变量变化的问题,在处理这些资料时候,对变量排序尤为重要。

2024-09-21 08:00:00 5

转载 论文复现:包含交互项的假设检验

研究者往往忽略了与之对称的预测的检验:即将XX视作条件变量,检验ZZ的边际效应如何随XX变化,并绘制ZZ的边际效应图。当然,本文并不是建议研究者增加一个对称性的理论预测,而是论述额外提供ZZ的边际效应如何随XX变化的检验可以提高检验力度,如果忽略这一步骤,有可能低估或夸大了对理论实证检验的可信度。

2024-09-20 18:30:48 36

转载 交乘项:交互作用需要交互控制

如果研究者感兴趣的是回归中的交互作用,那么混淆控制变量也应该是交互作用。为对上述问题有更好地理解,我们将以Card 和 Dahl (2011)为例进行说明,该论文研究了美国橄榄球赛季 (NFL) 比赛后的家庭暴力。之所以选择这篇论文,是因为它提供了一个直观的设置来解释控制变量采用交互项的必要性。

2024-09-20 18:17:21 14

转载 Stata:随机抽样命令介绍-gsample

gsample。该命令不仅支持简单随机抽样 (SRS),也支持不等概率抽样 (UPS),并且 SRS 和 UPS 两种方法均提供有放回抽样和无放回抽样。此外,gsample还支持分层抽样和整群抽样。关于moremata更多安装方法,详见连享会推文moremata程序包手动安装方法。其中,表示样本的大小。在不指定时,gsample默认将内存中的数据替换为随机顺序的采样观测值。指定以后,gsample会存储一个反映观测值抽样频率的新变量。

2024-09-20 17:16:53 31

转载 让「记录」变得简单:Markdown使用详解

Markdown 是一种极轻量的文本标记语言,它是以一种易读易写的纯文本方式编排文档,也对代码、图片、公式和表格等支持良好。Markdown,足够轻量,意味着它简单易学,十几分钟便可上手;它以纯文本的方式编排文档,意味着它体积小、很容易迁移与分享。最关键的是,Markdown 几乎无处不在。在课程笔记、学习讲义的撰写,PPT 文稿制作,博客网站或诸多媒体平台等领域应用很广,是一款性价比非常高的工具。

2024-09-20 10:43:57 40

转载 multihistogram-多变量直方图

直方图是一种统计图表,用于表示数据的分布情况。它通过将数据分组到连续的、不重叠的区间 ( bin ) 中,并用柱状图的形式来展示每个区间内数据的数量或频率。直方图可以帮助我们理解数据的分布特征,比如数据的集中趋势、离散程度和偏态等。通过直方图,我们可以快速地识别数据的分布模式,比如正态分布、偏态分布或多峰分布等。在实证分析中,有时我们需要比较不同变量或同一变量不同样本的分布,这可以通过绘制多变量直方图来实现。而在 Stata 常用的绘制多变量直方图命令中,变量x和y。

2024-09-20 09:56:39 24

转载 Stata代码规范指南

汪京 (兰州大学)

2024-05-05 22:42:18 228

转载 Stata绘图:地图神器geoplot

geoplot是一个强大的工具,能够基于shape file和多种数据文件绘制出详尽的地图。它具有很好的运行速度,这主要得益于其采用了数据框来存储绘制地图所需的一个或多个数据文件 (主要通过geframe命令来实现)。geoplot提供了丰富的地图要素,包括区域、边界、湖泊、道路、标签和符号等,这些元素可以根据需要进行自由组合,从而创建出丰富多样的地图效果。可以通过参数来调整图层的外观,如颜色、透明度等,从而进一步增强地图的信息传递能力。Stata绘图:地图神器geoplot。

2024-05-05 22:30:34 455

转载 FE vs POLS:聊聊固定效应-优点和缺点

随着面板数据使用的普及,固定效应 (FE) 回归模型在社会学中的重要性日益突显。然而,在一些研究中,这些模型的潜在缺陷可能被忽视,对固定效应模型的常见批评也并不总是适用于其他方法的比较。本文旨在概述线性固定效应模型及其应用研究中的潜在问题。本文将固定效应模型与经典的混合横截面数据模型 (POLS) 进行对比。本文认为,在大多数情况下,固定效应模型至少与 POLS 一样好。因此,鼓励学者尽可能采用固定效应模型。然而,固定效应模型的局限性也应该被认识和考虑。

2024-05-01 11:31:28 635

转载 ⚡新版lianxh命令发布了!

lianxh命令可以帮助用户便捷地在 Stata 中检索相关推文,同时,也可以列出常用的 Stata 资源链接。

2024-05-01 11:27:42 126

转载 getiref:快速获得文献的引文和PDF原文

连玉君 (中山大学)写推文和论文时经常需要引用文献,或者即刻查看某篇文章的 PDF 文档或 Google Scholar 引用情况。现在,这些目标可以用getiref命令一次性搞定。如果附加选项,还可以自动把文献的 PDF 文档下载到当前工作路径下。如下推文介绍了 48 篇发表于 QJE 的论文,它们的引文信息都是用getiref下面这篇论文的参考文献信息也是用getiref。

2024-05-01 11:16:40 93

转载 Stata数据处理:缺失值填充-autofill-carryforward

autofill命令直译为自动填充,可利用 Stata 数据中已有的数值来填充缺失值。它应用范围广泛,适用于 Stata 中所有类型的缺失值。此外,该命令还可以按组别对缺失值进行补全,这对分组处理数据缺失值有极大助益。其中,varlist对应数值中含有缺失值的变量。对于如果选择forward,程序将使用现有的数值来替换它们之前的缺失值。如果选择backward,程序会使用现有的值来替换它们之后的缺失值。选择一个变量,按照其连续相同的观察值进行分组。在每一个分组中独立执行autofill命令。

2022-12-31 12:29:52 5902

转载 Stata数据处理:快速转换Wind数据-reshapewind

如何简单而又快速地将从 Wind 数据库或者 Choice 金融终端下载的年度、季度数据转化为计量经济学所要求的面板数据类型,一直是实证分析中一个不可避免的问题。为此,笔者遵循简单原则,将机械重复的处理过程封装进。命令中,以此来帮助同学们更加高效地完成数据处理。

2022-12-31 12:27:22 1682

转载 总体与样本:定义、差异与示例

总体:通常指研究者感兴趣的问题所涉及的整个群体,既可以是有限的也可以是无限的。样本:指由研究者从总体中抽出的一部分个体所组成的集合,样本集合中个体的数量往往小于总体中个体的总数。Population 这个词汇具有一种引导研究者将总体概念与人类联想在一起的思维倾向,但是在实际研究中,总体可以是我们所感兴趣任何群体:对象、事件、组织、国家、物种、生物等等。总体概念的关键并不在于它指代的到底是什么,而在于不论它指代的具体是什么,它必定包含这个被指代对象的全集。

2022-12-31 12:26:28 548

转载 Stata:最大似然估计(MLE)简易教程

本文主要是介绍最大似然估计 (MLE) 的一些基础知识,并演示如何在 Stata 软件中进行最大似然估计。

2022-12-31 12:19:38 1531

转载 Stata:如何理解三个变量的交乘项?

多元回归模型中经常包含交互项,也会出现三个连续变量交互的情况,但是应该如何理解三项交互的含义呢?​我们摘译了 UCLA FAQs 中的相关介绍,从斜率的角度加以解释:How can I understand a 3-way continuous interacation?。

2022-12-31 12:17:50 3331

转载 Stata:高度共线性情况下的IV估计-pariv

本推文介绍了 Young (2022) 所提出的,适用于高度共线性下的稳健 2SLS 估计方法,以及其在 Stata 内的实现代码与过程。

2022-12-31 12:14:21 261

转载 Stata:Mundlak方法的DID-jwdid

Wooldridge 证明了双向固定效应 (TWFE) 与包括单位时间均值和时间段特定横截面平均值的混合 OLS (他称之为双向 Mundlak (TWM) 回归) 的结果具有等价性。该等价意味着异质趋势的标准策略可用于放宽共同趋势假设,尤其对渐进型 DID 有效。此外,双向 Mundlak 回归也很容易适应非线性模型,例如指数模型和 logit 和 probit 模型。Stata 的命令jwdid提供了基于 TWM 法的估计结果。

2022-12-31 12:13:00 469

转载 Stata:计算绿色全要素生产率-gtfpch

Chung 等 (1997) 把环境污染视为非期望产出,开创性的采用方向性距离函数,并结合 Malmquist-Luenberger 指数测算出了瑞典 39 个造纸厂在 1986-1990 年的绿色全要素生产率。由于这一指数在传统 DDF 基础上加入了非期望产出,因此可以称之为绿色全要素生产率。测算绿色全要素生产率的主要工具是 MLPI,随后又延伸出了四种比较重要的绿色生产率测算方法,分别是序列 MLPI (SMLPI) 、全域 MLPI (GMLPI) 、两期 MLPI (BMLPI) 和共同前沿 MLP

2022-12-31 11:56:17 3839

转载 最新最全参考文献:气候经济、环境经济、能源经济

本文内容摘录自 Asjad Naqvi 教授的 github 仓库 climate-econ。该仓库一直在更新,网址为:https://github.com/asjadnaqvi/climate-econ

2022-12-11 19:27:05 233

转载 工具变量:教育回报IV探讨

教育回报IV探讨

2022-12-11 19:24:51 516

转载 做学术需要搞清楚计量经济学里全部的数学原理吗?

做学术是否需要搞清楚高级计量经济学里的原理呢?

2022-12-11 19:22:22 429

转载 Stata编程:暂元local和global的使用技巧

在使用 Stata 运算时,每个人或多或少都曾遇到过变量繁多、程序复杂,让人眼花缭乱,以及不断做重复性步骤,降低工作效率。其实,Stata 中的暂元 (macros) 以有效解决这些问题。接下来,我们将从暂元 (macros) 的定义、种类、使用技巧和注意事项等几个方面做一个梳理,以帮助大家快速了解暂元。

2022-12-11 19:20:33 7490

转载 DID-倍分法:事前趋势检验的局限性和诊断

通常来说,我们希望事前趋势的系数都显著的不异于 0。然后我们就得出结论,因变量的事前趋势在处理组和控制组之间是很相像的。因此,控制组是“良好的”。Roth (2022) 这篇文章告诉我们,pre-trend test 有两个问题。

2022-12-11 19:18:51 1105

转载 对PhD一年级新生有什么建议?

本文旨在整理知乎热议上对 PhD 一年级新生在课业学习、科研日常、导师指导以及生活休闲等方面的宝贵建议,给正在读或者即将读 PhD 一年级的新生提供可供借鉴的经验与教训。

2022-12-11 19:15:11 233

转载 Stata:如何理解回归中的控制

如何理解回归中的控制

2022-12-09 12:37:22 4420

转载 Stata绘图:COVID-19数据可视化

​在本操作指南中,我们将要学习如何从Our World in Data网站中获取公开的新冠肺炎数据,并在 Stata 中绘制“山脊图” (也叫“峰峦图”或“堆叠图”)。在本指南的最后,我们将学习绘制下面的图片。

2022-12-09 12:35:15 472

Stata101:人手一份的入门指南-连玉君

花了几天的时间,用 Markdown - Marp 做了一份幻灯片,介绍了 Stata 的基本操作,以及常用资源和链接。 这不是一份操作指南,而是一份地图,方便各位在需要的时候查阅。 封面图片是动画片「极速蜗牛」的剧照,我很喜欢这只蜗牛的励志故事。

2024-09-20

profile.do

连玉君的 profile.do 文件。下载后放置于 stata 安装目录根目录下,重启后生效。 可以通过 dofile editor 打开后按照自己的需要进行修改。

2017-09-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除