公司金融
文章平均质量分 81
celine0227
这个作者很懒,什么都没留下…
展开
-
融资约束各指数
KZ指数借鉴Kaplan and Zingales(1997),以中国上市公司为样本构建KZ指数,用以衡量融资约束程度。具体而言,按以下步骤构建KZ指数:1. 对全样本各个年度都按经营性净现金流/上期总资产()、现金股利/上期总资产()、现金持有/上期总资产()、资产负债率()和Tobin`s Q()进行分类。2. 如果低于中位数,则取1,否则取0;如果低于中位数,则取1,否则取0;如果低于中位数,则取1,否则取0;如果高于中位数,则取1,否则取0;如果高于中位数,则取1,否则取0。3. 计原创 2022-05-23 18:34:04 · 21480 阅读 · 0 评论 -
样本选择模型 & 处理效应模型
一、样本选择偏差与自选择偏差样本选择偏差样本选择偏差的非随机选择机制在于对样本的选择不随机。在样本数据的采集过程中,只对某部分群体进行调查,但这部分群体与其他群体在某些方面的特征差异较大,因此根据这样的样本做回归得到的普适性结论并不可信。体现在具体的数据集中就是,数据集中只有特定群体的样本,或者,虽然有全部群体的所有解释变量数据,但除特定群体之外的其他群体的被解释变量数据缺失,在这两种情况下进行的回归,都将直接忽视其他群体的样本信息(y缺失的样本在参与回归时将被drop掉)。实质上,样本选择偏差说的原创 2022-05-16 19:02:59 · 8144 阅读 · 1 评论 -
探讨计量经济学与机器学习
一、计量经济学与机器学习的联系和区别:共通之处在于二者所使用的“原材料”和任务的形式的高度相似性。简单来说,两类方法的最终输入都是结构化数据。你有一个因变量,有一堆自变量,有好多的个案。最后的目的都是对自变量进行一通操作来去“近似”这个因变量。区别在于使用两类方法的根本目的是不一样的。使用计量经济学方法目的是进行结构分析,也就是说我们最后是想知道哪些自变量会对因变量产生影响,影响有多大;只关注变量的系数和显著性。与之不同,使用机器学习方法的目的就是用一大堆自变量去预测因变量。更关注预测的准确度。原创 2022-04-27 21:23:08 · 3749 阅读 · 0 评论 -
聚类稳健标准误
一、为什么?对样本做回归分析的核心是使用最小二乘法去估计模型里的参数,比如核心解释变量前面的系数。我们通过最小二乘法使得残差平方和最小,求得样本估计系数。如果进行一次估计,由于干扰项e的存在,估计值与真实值之间一定存在差异。样本估计值与真实值之间的差别中,误差项起了关键作用。误差项是一个随机变量,每次估计都会得到不同的差异值。关于样本估计系数性质的讨论,都以误差项为核心。我们希望样本估计系数特别好,接近真实值,所以必须有良好的性质,而良好的性质需要有前提条件,也就是一些假设。比如,我们希望反复抽原创 2022-04-25 15:48:45 · 28282 阅读 · 4 评论 -
PSM+DID
PSM-DID 模型是由倾向得分匹配模型 (Propensity Score Matching,以下简称 PSM) 和双重差分模型 (Differences-in-Differences,以下简称 DID) 结合而成。其中,PSM 负责为受处理的个体筛选对照个体,DID 负责识别政策冲击所产生的影响。PSM 适用于截面数据,而 DID 适用于面板数据。针对二者适用范围不同的问题,学者们一般有两种解决方案: 一是将面板数据直接转化为截面数据进行处理; 二是在面板数据的每期截面上进行逐期匹配原创 2021-10-31 12:01:57 · 38494 阅读 · 4 评论 -
Heckman 两阶段法及与工具变量法的区别
一、适用范围Heckman两阶段模型适用于解决由样本选择偏差(sample selection bias)造成的内生性问题。在经济学领域,样本选择偏差的典型例子是研究女性的受教育情况对女性工资的影响。按照这个思路,一般会去问卷收集或在哪个网站下载部分女性的受教育情况,工资,及其他特征数据,例如年龄,毕业院校等级等个人特征,然后做回归。不过这样做有一个问题,就是登记的女性,都是在工作的,但是许多受教育程度较高的女性不工作,选择做家庭主妇,这部分样本就没有算在内,样本失去随机性。这就导致模型只是用到了在原创 2021-10-29 11:59:36 · 18444 阅读 · 1 评论 -
DID模型
政策评估 (Policy Evaluation) 是当前公共经济学和劳动经济学中最常用的实证方法。其目的在于评价一项既有政策的效果,此类研究关注的是该政策的处理效应 (Treatment Effect)。由于政策往往是对一类特定的人群起作用,政策评估的基本思想是将这类人群与其他人群进行比较。目前,双重差分模型 (Difference-in-Differences) 是用于政策评估的常用模型。1.1 因果识别思路 对特定个体,表示第期的个体受到政策影响 (处理组),表示第期的个...原创 2021-10-24 10:46:01 · 26650 阅读 · 3 评论 -
解决内生性问题
1. 内生性来源内生性问题 (endogeneity issue) 是指模型中的一个或多个解释变量与误差项存在相关关系。换言之,如果 OLS 回归模型中出现,则模型存在内生性问题,以致于 OLS 估计量不再是一致估计。进一步,内生性问题主要由以下四种原因导致。1.1 遗漏变量在实证研究中,研究者通常无法控制所有能影响被解释变量的变量,因此遗漏解释变量 (omitted variables) 是很常见的事情。假设 OLS 模型中解释变量为和,研究者遗漏的解释变量为如果遗漏的变量...原创 2021-10-14 20:27:36 · 22786 阅读 · 1 评论 -
二值选择模型
被解释变量是离散的一、二值选择模型(两种选择)为了使y的预测值总是介于[0,1]之间, 在给定x的情况下,考虑y的两点分布概率: a. 如果为标准正态的累积分布函数(cdf),则该模型成为“Probit”b. 如果为“逻辑分布”的累计分布函数,则 该模型成为“Logit”。由于逻辑分布累积分布函数有解析表达式,存在解释表达式,回归系数更好解释。Logit回归的系数,转换为or值后,表示的是p/1-p的大小。Probit模型没有经济意义,需要通过边际效应进行求值..原创 2021-09-16 22:45:56 · 8499 阅读 · 0 评论 -
固定效应模型
一、面板数据优点1. 可以解决遗漏变量的问题:遗漏变量由于不可观测的个体差异或“异质性”造成的,如果这种个体差异“不随时间而改变”,则面板数据提供了解决遗漏变量问题的又一利器。2. 提供更多个体动态行为的信息:由于面板数据同时有横截面与时间两个维度,优势它可以解决单独的截面数据或时间序列数据所不能解决的问题。3. 样本容量较大:由于同时有截面维度与时间维度,通常面板数据的样本容量更大,从而可以提高估计的精确度。估计面板数据长假定个体的回归方程拥有相同的斜率,但可以有不同的截距,以此来捕捉异质原创 2021-09-16 17:36:15 · 65767 阅读 · 3 评论 -
一行代码实现安慰剂检验
1. 什么是安慰剂检验随着「因果推断方法」在实证研究中的使用比例不断提升,越来越多的文章也会进行安慰剂检验。其检验基本原理与医学中的安慰剂类似,即使用「假的政策发生时间或实验组」进行分析,以检验能否得到政策效应。如果依然得到了政策效应,则表明基准回归中的政策效应并不可靠。进一步,经济结果可能是由其他不可观测因素导致的,而非关注的政策所产生。2. 为什么要进行安慰剂检验在实证研究中,无论是稳健性检验,还是安慰剂检验,亦或是异质性分析,其背后真实的目的只有两方面: 第一,使得文章故事性更强,逻原创 2021-09-16 15:42:44 · 15887 阅读 · 10 评论 -
stata实证之前通常处理步骤
1. 剔除缺失数据在主回归文件有缺失内容时,剔除掉缺失值keep if _merge==3数据处理结束——删除因变量缺失的数据drop if missing(size, lev, growth, roa, cashflow, btom, largesthold,dyratio,dgjhold,dgjwage,ncskew,duvol,sigma,ret,ipoage,board,ind_board, yretwd,inholding,analysts,industrycode,soe原创 2021-09-14 22:46:27 · 10720 阅读 · 1 评论 -
stata计量之前数据清洗的必备步骤
数据清理第一步:整体数据查看一、查看识别变量--isid、duplicates一般而言,每个数据集都有唯一一个识别每条记录的识别符(重复测量的长型数据除外)。Stata检查唯一识别符是否唯一的命令为isid(或许是is this an ID的缩写)。isid允许同时检查多个唯一识别符,如果没有返回值,就说明是唯一的(没有消息就是好消息);如果不唯一,就会出现红色提示variable *** does not uniquely identify the observations。如采用下面例子中的查重原创 2021-08-24 15:17:48 · 26965 阅读 · 0 评论 -
区分“研发支出“、“开发支出“、“研发费用“
一、概念区分首先,区别"开发支出"和"研发费用"是报表项目,"研发支出"是会计科目。其次,"开发支出"报表项目应根据"研发支出"科目中所属的"资本化支出"明细科目期末余额填列。"研发费用"报表项目应根据"管理费用"中与研发相关的费用加上自行研发的无形资产的摊销金额来填列。补充说明:1.自行研发无形资产分为研究和开发两个阶段。研究阶段发生的支出全额计入"研发支出--费用化支出",期末转入"管理费用"。开发阶段发生的支出符合资本化条件的计入"研发支出--资本化支出",当无形资产达到预定可使用状态原创 2021-08-24 11:12:43 · 3819 阅读 · 0 评论