产经文献阅读随记——记下那些想法与方法

最新推荐文章于 2024-08-25 14:50:51 发布

yyzzxmy

最新推荐文章于 2024-08-25 14:50:51 发布

阅读量248

点赞数 1

本文链接：https://blog.csdn.net/yyzzxmy/article/details/117441832

版权

(随看随更，记下来是加深一遍记忆，同时方便以后翻看)

一、想法与方法

1）评估企业融资约束的方法

21.5.31
1.基本思路为，如果企业受到融资约束，则企业的发展受限于自己拥有的资金水平。该资金水平可以使用企业的现金流衡量。如果我们发现，企业的发展速度在控制其他变量后会显著受到企业现金流的影响（如果现金流少，继续投入的本钱少，增长慢），那么就认为企业受到融资约束。

2.来自某老师的进阶思路。企业能借到多少钱同时取决于企业的借钱需求和银行的放贷供给。只有当意愿的供给量小于企业的需求量时，才展现为受到融资约束。我们在现实中可以观测到企业的贷款数额 $L = m i n (S, D)$ ，以及约束 $a = 1, i f S < D$ 。于是可以同时估计该企业的需求与银行对该企业的供给，计算 $P r (S < D)$ 作为企业的融资约束。

3.按照基本思路，进一步估计企业受到融资约束的程度。使用企业利润增长率对企业的基本面进行回归（除了现金流），得到残差 $e_{it}$ 。如果企业受到融资约束，则残差必与企业现金流 $cash_{it}$ 相关。定义企业的资金现金密度 $cfd_{it}=cash_{it}/as_{it}$ 。那么，如果我们计算现金密度加权的残差均值与无加权的残差均值进行比较，就可以得到企业受到融资约束的程度。
$sens_{it}=\sum_{t=1}^T\left(\frac{cfd_{it}}{\sum_{\tau=1}^Tcfd_{i\tau}}-\frac{1}{T}\right)\hat{e}_{it}$
(寇宗来, 毕睿罡, 查存. 融资约束对企业广告和研发策略的影响:理论与经验证据. 世界经济, 2020, v.43;No.500(04):30-53.
Hovakimian，G.“Determinants of Investment Cash Flow Sensitivity. ”Financial Management，2009，38 ( 1 ) ，
pp. 161－183．)

2）评估企业全要素生产率（TFP）的方法

21.6.1/2
写在前面：TFP的研究早年间因为微观数据不足，只能聚焦于宏观层面，利用某地区人口数据、资本投入数据计算一个地区整体的全要素生产率水平。随着微观数据逐渐完善，学者们开始将目光投向具体的企业。TFP的估计方法非常多，以后看到了就会加上。
1.可以使用最为基本的柯布道格拉斯生产函数进行衡量：
$Y_{it}=A_{it}L_{it}^\alpha K_{it}^\beta$
其中， $A$ 即被视为全要素生产率，能够对各要素的边际生产能力造成影响。两边取对数后可以得到一个计量方程：
$y_{it}=\alpha l_{it}+ \beta k_{it}+u_{it}$
全要素生产率的信息就包含在残差项中。 $ln(\hat A)=\hat u$ 。
但是这种简单形式的计量会不可避免地遇到内生性问题。在TFP的估计中，内生性主要表现在企业的要素投入会随着企业的生产效率动态变化这一点上。
因此，如果我们想通过回归得到 $\hat\alpha、\hat\beta$ ，然后得到 $ln(\hat A)=\hat y-\hat\alpha l-\hat\beta k$ ，就需要考虑能够解决这种内生性的方法，来获得无偏的 $\alpha 与 \beta$ 。
Olley and Pakes提供了一个解决思路。(OP法)核心为以企业的投资额作为企业生产效率的代理变量。
首先，将简单回归式中的误差项 $u_{it}$ 拆解为：
$u_{it}=\omega_{it}+e_{it}$
其中 $\omega_{it}$ 表示存在内生性的部分， $e_{it}$ 表示与内生性无关的部分。
然后，假设企业的资本存量与当期投资额之间存在以下关系（如果模型、估计出现问题，多半是假设出现问题，不符合现实条件，需要更换假设，推导出新的模型。根据我的理解，该假设的目的在于计算出投资额 $I_{it}$ ）：
$K_{it+1}=(1-\delta)K_{it}+I_{it}$
以及，如果企业面对的 $\omega$ 较高（意味着企业生产效率较高），则企业将提高自己的投资 $I$ 。因此可以较自然的认为，投资 $I$ 与当期资本存量 $K$ 及效率冲击 $\omega$ 相关，有：
$i_{it}=i_{t}(k_{it}, \omega_{it})$
也就有：
$\omega_{it}=h_{t}(i_{it}, k_{it})$
如此，则原回归方程化为：
$y_{it}=\alpha l_{it}+ \beta k_{it}+h_{t}(i_{it}, k_{it})+e_{it} \\\phi_{it}=\beta k_{it}+h_{t}(i_{it}, k_{it}) \\y_{it}=\alpha l_{it}+\phi_{it}+e_{it}$
那么这一步回归时，在回归式中放入资本存量和投资额的多项式，就可以得到 $\alpha$ 的无偏估计量。
下一步，估计资本存量前面的系数。利用第一步回归的结果，得到
$V_{it}=y_{it}-\hat\alpha l_{it}$
再估计方程：
$V_{it}=\beta k_{it}+g(\phi_{it-1}-\beta k_{it-1})+\eta_{it}$
此处的 $g ()$ 表示函数，可以用高阶多项式近似。（增加这一项的目的应为控制 $\omega_{it}$ 。原理大致为，生产效率冲击 $\omega$ 的生成符合马尔可夫过程，当控制 $\omega_{it-1}$ 时， $\omega_{it}$ 也就得到了控制）不过为了估计的无偏性，此处拟合的精确度要求较高，可以在该函数上使用非参估计。
总之，估计后得到 $\hat\beta$ ，加上第一步回归时得到的 $\hat\alpha$ ，我们可以最终得到
$ln(\hat A_{it})=\hat u_{it}=\hat y_{it}-\hat\alpha l_{it}-\hat\beta k_{it}$

2.接着考虑第二个可能产生内生性的问题。我们观测到的数据中，不包含那些因为自己的效率过低，导致退出生产的企业。这就会带来估计方程中的自选择偏差（数据中存在的企业本身效率就较高/只有效率较高的企业才能被我们观测到）
对于这个问题，我们需要考虑企业的决策问题。每一期，当企业察觉到自己的生产效率后，可能做出以下决策：（1）继续生产并选择投入的要素量 $K 、 L$ （2）退出生产，将所有要素出售获得收益 $\Phi$ 。企业的最优化决策就可以用如下的贝尔曼方程表示：
$V_{i,t}(K_{it}, \omega_{it})=max\{\Phi, Sup_{I_{it}\geq0}\Pi_{it}(K_{it}, \omega_{it})\}-C(I_{it})+\rho E[V_{i,t+1}(K_{i,t+1}, \omega_{i,t+1})|J_{it}]$
当然，我们不需要解出这个方程。
观察这个方程我们可以发现，企业做每一期的决策时，都会根据自己的生产效率 $\omega$ 确定自己本期能够取得的最大收入，如果小于卖企业得到的价值（这也意味着 $\omega$ 较小），则企业就不会继续生产了。因此，设定企业的生存状态 $\chi$ ：
$\chi_{it}= \{ \begin{array}{lr} 1, if \ \omega_{it}>\bar\omega_{it}(I_{it}, K_{it}) \\0 \end{array}$
那么企业继续经营的概率就是：
$Pr(\chi_{it}=1)=Pr(\omega_{it}>\bar\omega_{it}(I_{it}, K_{it}))=\psi(I_{it}, K_{it})$
这意味着我们可以使用probit、logit等模型估计出企业继续经营的概率 $\hat P_{it-1}$ 。
我们可以将这个估计值放入最终的估计方程中，最终得到：
$V_{it}=\beta k_{it}+g(\phi_{it-1}-\beta k_{it-1}, \hat P_{i,t-1})+\eta_{it}$
其中的g()依然可以通过多项式的方式代入回归方程中，就可以估计出更加准确的 $\beta$ 了。

(鲁晓东, 连玉君. “中国工业企业全要素生产率估计:1999-2007.” 经济学:季刊.
待读Olley, G. S. , and A. Pakes . “The Dynamics of Productivity in the Telecommunications Equipment Industry.” Econometrica (1996).)

3）模糊厌恶（Ambiguity Aversion）

21.6.2
上课听到的，当笔记记了
行为经济学中目前比较热的研究方向，和风险厌恶是比较相似的概念。
$\sum_c q_c \phi(\pi_1^cu(x_1)+\pi_2^cu(x_2))$
比如说两种状态 $x_1,x_2$ ，每种状态下有效用 $u(x_1),u(x_2)$ ，则风险厌恶表现为函数 $u$ 为凹函数。 $\pi$ 表示每种状态发生的概率，因此该状态下的期望效用就为括号内所示。
然而在实际生活中，人们常常不能清楚地知道状态的分布情况。人们具有的是对分布情况的主观认识 $c$ 。人们在考虑分布的时候，往往考虑多种情景。比如说，乐观来看，分布如何；悲观来看，分布如何。因此在计算效用时，考虑人们每种主观认识的概率 $q_c$ ，以及在该主观认识下各情况的发生概率 $\pi^c$ 。最后还有函数 $\phi$ ，这是和效用函数 $u$ 相近的概念，表示人们考虑各种主观情况的收益(效用)，它的凹凸性就表明人们对模糊的偏好程度。一般来说，假定为凹函数，表明人们具有模糊厌恶，人们会更喜欢精确的事物。

4）安慰剂检验的一种方法

21.6.2/3
在双重差分中看到的安慰剂检验方法。从原理来说，可以用来检验回归方程中是否出现自相关现象。

1.简单描述一下双重差分方法（DID）。
我们研究的目的是想要说明，某个冲击/处理会对某个个体产生什么样的影响。比如说，专利法如何影响企业的创新行为。那么，衡量这种影响的最好办法，是比较有与没有这个冲击的情况下，某个企业的创新行为各是什么样子。即：
$E [Y ∣ T r e a t = 1, X] 与 E [Y ∣ T r e a t = 0, X]$
冲击的效应就可以表示为：
$E [Y ∣ T r e a t = 1, X] - E [Y ∣ T r e a t = 0, X]$
然而现实中，不可能既存在受到影响的A企业，又存在没有受到影响的A企业。因此，当存在受到影响的A企业时，我们需要能够构造出一个近似A企业却又没有受到影响的企业进行比较。
DID的思路就在于，找到没有受到影响的B企业，记录AB企业各两个状态：处理前与处理后的状态（当前语境下就是施行专利法前后企业的创新数量）
计量方程写为：
$Y_{it}=\alpha+\beta_1Treat_i*Post_t+\beta_2Treat_i+\beta_3Post_t+\textbf{X}\Beta+...+\epsilon_{it}$
结合DID来看各主要系数的含义：

	处理前（P=0）	处理后（P=1）	处理后-处理前
实验组（A企业，T=1）	$\beta_2$	$\beta_1+\beta_2+\beta_3$	$\beta_1+\beta_3$
控制组（B企业，T=0）	无(即基准)	$\beta_3$	$\beta_3$
实验组-控制组	$\beta_2$	$\beta_1+\beta_2$	$\beta_1$

双重差分的原理与名字的由来就体现在表中了。其实，就是我们熟悉的对照实验。依靠没有经过处理的对照组，将处理的作用突显出来。如果在实验之前，实验组和控制组的差异是一个稳定的数值；那么在实验后，实验组如果没有接受实验，和控制组应该仍具有一个稳定的差异。因此，可以通过控制组推出现实中不存在的没有接受过实验的实验组的情况，完成反事实组的构建。
实验的效应=（实验后实验组-实验后控制组）-（实验前实验组-实验前控制组）=（实验后实验组-实验后没有经过实验的反事实实验组）+（实验后没有经过实验的反事实实验组-实验后控制组）-实验前两组差距=实验的效应+实验后两组差异-实验前两组差异
DID的处理基本可以从实验组的变化中提取出受到处理而带来的变化。不过有一个基本假定：实验后两组差异=实验前两组差异（平行趋势假定）。
$\beta_1$ 就是我们想要估计的系数。

2.有一个目前没有想明白的问题，为什么有psm-did的存在。为什么did了还要用psm。等着翻文献

3.DID过程中可能遇到的另一个问题与安慰剂检验
问题在于，这个估计方程可能依然会遇到内生性的问题。考虑这么两个场景：
（1）国家制定的专利法是专门参考了AB两家企业的经营状况，择时择企推行的。这就意味着，AB企业本身的某些因素（可能在估计方程的 $\varepsilon_{it}$ 中）会影响到它是否受到实验，在哪一年受到实验。这被称为自选择现象（self-selection）。
（2）在专利法发布的同一年，恰巧有别的什么事件发生，影响到企业的创新行为。现实中比如08年，有金融危机、有奥运会，也有地震。这时只有上面这个方程，就无法说明是具体某个事件的影响。

3.检测是否存在内生性问题——安慰剂检验
在上面的回归方程式回归中，我们估计得出的系数 $\hat\beta$ 的值为：
$\hat\beta=\beta+\frac{cov(Treat*Post,\varepsilon)}{var(Treat*Post)}$
存在内生性问题，则意味着后面一项不为0，得出的估计值有偏。一个思路是，随机分配 $T r e a t$ ，然后进行回归，可以使得 $\beta=0$ 。如果估计出来 $\hat\beta=0$ ，则能说明后面这一项也是0。
这个思路已经被用到一些论文中了。
但是存在问题：随机分配 $T r e a t$ 的时候，后面一项里面的 $c o v$ 难道不会因为随机分配变成0吗？所以这样的做法有什么意义？
待详细研究。第一篇应用这个方法的文章似乎没有给出数学证明。

（寇宗来,刘学悦. 中国企业的专利行为:特征事实以及来自创新政策的影响[J]. 经济研究,2020,55(3):83-99.）

5）倾向得分匹配（PSM）

21.6.3
还沉浸在上一个问题之中，这里就简单写一下倾向得分匹配的思路。
1.当我们想要研究某一个treat的影响时，我们关注：
$E [Y ∣ T r e a t = 1, X] - E [Y ∣ T r e a t = 0, X]$
还是举AB企业技术创新和专利法的例子。A企业受到专利法的影响，而B企业没有；我们可能就想看看影响后A企业相对B企业多了多少技术创新。但要是假如A企业有1000名员工，B企业只有10名员工，我们如果发现A企业的产出高于B企业，未必能够确定是员工数目的原因还是专利法的原因。更进一步的，A组企业的员工数量50-1000人，B组企业的员工数量为20-100人。专利法只影响到A组（显然法律制定的时候，受到了可观察因素——员工数量的影响），那么当我们看到A组的技术创新确实高于B组时，可能无法判断是因为它员工普遍多，还是确实受到技术法的影响。倾向得分匹配就是为了解决这个问题。（可以从这里发现，DID完全可以解决这类问题。我只要观测两组企业在法律施行前后的表现，就可以知道法律到底是否有影响。因此，对于psm-did，即加上了倾向得分匹配的DID模型，我百思不得其解，不知道psm在这里是干什么用的。可能是将类似的数据点匹配到一起，使结果更具有DID本来就具有了的可信度?）
2.为了解决上述问题，psm提出匹配的想法。比如，我们取A组中人数在50-100的企业，去和B组中50-100人的企业进行对比，就可以排除人数的影响。这样，AB两组就匹配了，结果也就可以比较了。
这里的问题比较简单。如果说，企业的性质不止员工数量一条，还有资本、负债、增长率…那么这个时候要怎么匹配呢？当数据维度增加的时候，匹配的成功率就大幅下降了，基本不存在所有维度的数据都差不多的两家企业。（这被称为维度的诅咒，无参估计也会遇到类似的问题，因此出现半参估计，以后再写）
psm就可以解决这样的问题。它提出，对企业的这么多性质，拟合出一个得分来，用一个一维数据代表企业。通常使用的方法是logit模型，用企业的属性，拟合出企业会受到treat的概率p(x)，作为其得分。然后选择两组中得分相近的企业进行匹配，计算出treat的作用。
3.需要注意的是，psm的应用要有这样的前提。
（1）不存在内生性问题，我们控制了x之后，企业是否会受到treat的概率就确定了。否则，我们算出来的p(x)有偏，并非真实的那个概率。
（2）当两组企业中，企业性质数据存在重叠，才能够应用psm方法。比如说，A组企业1000人，B组企业10人，那在A、B组之间就不可能存在匹配。放到p(x)的场景，就是要求在p(x)的某一个数值下，同时存在A、B两组企业，才能将这个p(x)数值下的企业纳入研究范围。比如A组企业50-1000人，B组企业20-100人，那就截取两组中50-100人的企业进行匹配。
{（3）因为（2），所以会有一些数据点被抛弃。我们需要保证抛弃的数据不会使原始数据的分布发生变化。比如说，如果抛弃掉一些数据样本后，发现y的均值下降了一截，那可能就难以得到无偏的结果。}
第三条存疑，个人感觉没必要有这个要求。

4.匹配时，可以最近邻匹配，也可以以距离加权，1A匹配多B；还可以匹配半径内的所有B等等方法。

6）拉格朗日乘子法和库恩塔克（KKT）定理

挖坑

7）市场中的价格离散（price dispersion）

衡量市场中价格的离散程度的指标：
1.CoV(Coefficient of Variance，变异系数)，衡量的是产品价格的标准差与平均值的比值。即CoV=Var/Mean
2.VoI(Value of Information)，衡量产品的平均价格比最低价格高出的比例。名字的含义就是，如果我拥有额外的信息，我购买该产品时的价格就可以降低。VoI=(Mean-Min)/Min
3. $D_{\_1\_2}$ 衡量产品的最低价与次低价之间的差距。

按照经济学理论，在一个有效的市场中，不应该存在价格离散的情况。然而现实的数据中却往往表现出离散价格的情景。原因可能如下：
1.消费者侧，信息搜集需要成本。考虑到消费者未必会遍历市场中所有该产品的售价，厂家为自己的产品制定不同的价格就有其合理之处。
2.厂商侧，改变价格也需要花费成本。至少需要管理层搜集竞品与需求侧的资料，并通过开会决定价格的改变。因此在实际生活中表现出价格的黏性。