全文阅读:https://www.lianxh.cn/news/9a9252b4d6a6c.html
目录
- Q1. 请问老师,找控制变量的原则是对被解释变量有影响,且在相关文献中运用过吗?最后是否可以通过删减控制变量来使回归结果尽量显著?谢谢
- Q2.对于 Logist 异方差性会产生什么问题以及怎么解决?
- Q3. 老师好,请问跑模型的时候,控制变量的选择依据,是根据模型本身去找,分析选择每个控制变量的理由,还是可以按照已有文献,说明引用哪些作者就行?(这一块知识点比较模糊)
- Q4. ols 假设中, 如何推出 x 和 u 不相关?
- Q5. 老师好,请问:加入某个重要控制变量,是否能作为一个稳健性检验,之前看到中国工业经济有文章这么做过,但是这种情况不多见,不知我们写文章的时候是否可以合理参考这样的稳健性检验方法?
- Q6. 如果有 10 个地区,是不是不要常数项只能加入 9 个虚拟变量?虚拟变量是单独加入还是得和其他变量做交乘,stata 上命令具体怎么实现?
- Q7. 不同解释变量的系数不能直接比大小吧?
- Q8. 连老师好,请问 mutiple treated unit 的合成控制法现在是不是还需要自己编程序,因为在我的研究中处理组已经超过 25 个了。
- Q9. 在做宏观经济对身高的影响时,可以在做 trends and association 图时用 zscore 或者标准化值,但是在 regress 中用取对数的值做,也就是说两部分对数据不同的处理,请问可以这样操作吗?
- Q10. 用面板数据做经济对身高的的影响,除了用固定效应,logit,还可以用什么方法吗?可以用 GEE(广义估计方程)做吗?这次老师会讲到 GEE 吗?老师有关于 GEE 的视频实操课推荐吗?谢谢连老师。
- Q11. 请问老师: 怎么理解 OLS 常数项去均值/中心化的作用呢?这个作用有什么意义呢?(是为了满足 OLS 的假设吗?)
- Q12.拿到的问卷有的回答不在选项中,比如显示为 -2,179,那这些数据在初步处理时是把删掉吗?因为是官方数据,也无法知道调查中出现这些不正常值的原因。
- Q13. 请问老师在异质性分析时,分组回归和使用交乘项回归的区别是什么?两种方法是否有各自的适用条件呢?
- Q14. 老师,可以分享一下实证分析和论文写作的逻辑/结构吗?另外可以分享如何才能写好论文、讲好故事吗?谢谢老师。
- Q15. 管理领域公司层面的研究经常是控制行业、控制上市板块,比如说是创业板的某几个行业公司的全部样本,这个时候并不算是从母体(如果希望理论的一般性,母体应该所有公司,至少是上市公司)中随机抽取,因此 `Boostrap` 和 `Jackknife` 都无法适用?
- Q16. 在使用 `bootstrap` 抽样法时,从现有样本中可重复抽取 N 个观察值,这个 N 等于初始样本的数量吗,比如说 80 个初始样本, `bootstrap` 就是可重复抽取 80 个观察值,抽取 500 或 1000 次?
- Q17.老师,我们在进行 t 检验的时候您设定的 H0 为什么是 β 呢?一般的话不应该是 H0 设定为 β 跑出来的值吗?
- Q18. 不考虑 `jackknife` 和 `bootstrap` ,就普通 `ols` 而言,`se(B)`生成的原理是什么?比如 `auto.dta` 样本数就 74 个, `ols` 内部会跑好几遍回归,得到不同的系数值?
- Q19.刀切法计算标准误时对 = (外生性假设) 的要求具体体现在哪里?
- Q20. `Bootstrap` 每次随机抽样抽出的样本数 `N` 是多少呢?会随着研究问题改变而改变吗?
- Q21.怎么判断回归中有没有异方差呢?
- Q22. 请问累计异常回报率 `car` 怎么计算?在 Stata 里怎么实现?
- Q23. Stata 中画出的散点图是不是没法显示每个观测点的具体数值?能否实现让它显示某些点取值?
- Q24. 在回归分析中,如何判断具体是哪几个变量存在多重共线性?同时,如果存在几组变量的多重共线性(即 va 和 vb 共线,vc 和 vd 共线),如何判断?谢谢。
- Q25. 如果随机扰动项不服从正态分布那么可能就需要用刀切法,但是实践中如何知道随机扰动项是否服从正态分布呢?
- Q26. Stata 是否有从多份 `excel` 格式的年鉴数据中抓取所需数据的方法?
- Q27. 最高层级 `cluster` 的最高层级是什么意思?
- Q28. 请问一下, `dominA rank` 这个命令是不是主要用在分析类似于“有哪些因素对于 y 有影响”这一类的研究问题上?如果对于只有两个解释变量的话用这个命令的意义是不是不大?谢谢。
- Q29.在什么情况下使用标准化后的系数,什么时候使用原始的系数?
- Q30. 做 OLS 的时候出现 R2 和 adj-R2 为负: -0.27 和 -0.35,意味着什么呢?模型不能解释 y?这样的结果可以用吗?
- Q31.老师,异方差处理一般用 robust、vce(cluster),什么情况下会用 `Jackknife` 和 `Bootstrap`呢?谢谢老师!
- Q32.老师,昨天讲的常数项的作用是为了去均值,这里还是不太明白,如何体现出去均值呢?还有加入虚拟变量的作用是实现组内去心,也不是很清楚。
- Q33.面板数据回归中,会经常看到在标准误计算上,有用 robust 的,也有用 cluster 的,请问这两种之间会有什么区别?用哪一种会更符合投稿要求呢?另外,老师上午说 cluster 里面用的是最高层级,但使用个体效应和年份效应时,cluster(id)?但我经常看到 cluster(id,year),这又该如何选择?
- Q34.面板数据回归中,有用 `reg Y X i.industry i.year,r`;也有用 `xtreg Y X i.year,fe r`。是当 `xtreg` 回归显著时报 `xtreg` 的结果,不然就使用 `reg` 的回归结果?
- Q35.面板数据回归中,有时候除了会 i.industry 和 i.year 之外,还会 `i.industry#year`。请问什么情况下会 i.交乘项?另外,有文章只是 `i.industry*year` 和 `i.area*year`,没有放单独的 `i.industry、i.year 和 i.area,请问这又是在什么情况下会这么做?
- Q36.每个扰动项都是固定的,为什么说每个扰动项服从正态分布?另外,方差总残差估计,每个类别中,聚类的相关性是如何计算的?
- Q37.组间系数检验的三种方法的区别及平时哪种方法用的多?
- Q38.实证操作上的一个细节,就是中国上市公司的行业分类,在 2012 年证监会行业分类发生变化,在研究区间内有的公司行业会发生变更。请问,一个面板数据跨度在 2001-2019 年,里面既有公司的行业代码发生变更,在 12 年也会出现前后同一行业代码不一致的情况,那么在计算与行业相关的变量时怎么办,如计算行业财务杠杆的均值。是不是需要将 12 年前后的同一行业代码变成一致的,而行业发生变更就看成是这个公司分属了两个行业?但有时候发现行业变更正好在研究区间的最后一年,这种要不要更改公司的行业呢?
- Q39.请问什么时候用 lincom?
- Q40. 想问一下画图的问题:怎么用 histogram 将两个变量画出 byhist 的效果?试了一下 byhist 只能画一个变量,通过 by 分组;若是现在在数据库中已经完成分组,例如男女工资是分别的两个变量,怎么画出 byhist 的效果呢?
- Q41. tobit 回归分析数据时,有时候 R2 是负数,请问是怎么回事?结果不好汇报。
- Q42. 运行程序,说很多命令无法辨认,unrecognized,应该怎么把命令能进去?
- Q43. A2data 中第 348 行 sepby(code) noobs clean 是什么意思?
- Q44.能否解释下 A4 regress 第 276 行结果中每个值的意义?
- Q45.能否分享搜狗短语定义配置文件,并介绍如何贴入我的配置文件?
- Q46.回归中的 R 方为负数的原因以及怎么处理?
- Q47. 面板数据回归中,`reg Y X controls i.industry i.year,r`时,X 正向显著;`xtreg Y X controls i.year,fe r`时,X 负向显著。请问这是出现什么问题了呢?该如何抉择呢?
- Q48. 1605 行中产生了很多交互项,但是只有一个交互项显著,其他不显著的交互项是全部保留还是去掉呀?如果去掉交互项,它们的初始变量要不要去掉呀?比如去掉 A\*B,A B 是不是也要相应去掉啊?
- Q49.老师请问咱们回归分析 1420 行的 noci scheme 是用来做什么的呀?谢谢!
- Q50.老师请问我们第三课课件 402 中的 c(s)是什么意思呢?
- Q51.连老师好,请问 mutiple treated unit 的合成控制法现在是不是还需要自己编程序,因为在我的研究中处理组已经超过 25 个了。有没有直接能拿来参考的?谢谢老师。
- Q52.老师好 请问我们第三课课件 645 行 `dis in g “*” _c`可以再解释下嘛
- Q53.老师好 请问第三课 738 行为什么要建 local v 然后 insheet v 来导入文件,为什么不直接用循环语句导入呢?
- Q54.对于 Logist 异方差性会产生什么问题以及怎么解决?
- Q55.我们大多数的数据都是面板数据,它会把不含时间效应的变量自动删除,但我们不可能把不含时间效应的变量都删除的,该怎么办?此时只能用随机效应模型吗?
- Q56.如果个体效应和解释变量都高度相关,怎么再用随机效应模型呢?
- Q58.将一个行业层面的变量作为核心解释变量,去估计企业层面的变量,在固定效应时可以固定到哪一层面,可以固定企业吗,以及,可以固定省份吗?
- Q59.老师好,请问是否可以再详细介绍一下 lincom 背后的含义呀,比如行 1461 的那行命令的语句,为何要这么做,以及检验结果如何解释。
- Q60.当设计柱状图的时候,老师可否演示一下过程,比如有 A=30,B=40,C=50,D=A+C+D+E,想要画出 ABC 的柱状图,并显示出百分比数据。自学了连享会上的那篇说柱状图的文章感觉还是挺复杂的,希望老师演示一下,谢谢!
- Q61.如果在控制变量里面同时有企业,行业和国家层面数据,在同时控制了企业,行业和国家层面的固定效应后,cluster 到哪个层面合适呢?还是行业层面吗?
- Q62.调节变量的系数有没有意义呢?
- Q63.交乘项:放入 z 之后交乘项的系数不显著时,若理论分析 z 会影响 y,那么模型里面就必须放 z 是吗?这个时候可以选择去中心化吗,若是去中心化之后还是不显著,那么该怎么解释呢?
- Q64.老师好,请问在 Stata 做回归模型时,聚类和虚拟变量有什么区别吗:`cluster(industry)和 i.industry`。
- Q65.残差过大的情况(怎么判断呢?),考虑异方差处理(white,jackknife,bs); 那么常数项过大的时候,该怎么处理呢?或者该怎么解释呢?
- Q66.如果回归方程中同时加入一次项和二次项与调节变量 Z 的交互项,是否合适?回归结果应该如何解释呢?
- Q67.请问老师能否补充讲一些 `logit` , `probit` 的模型?
- Q68.老师在讲固定效应时的例子时,如果用混合 ols 和虚拟变量与固定效应模型会有差别吗?
- Q69.442 行表格中固定效应的 4 种估计方法,列式结果是不是不一样?(4)FE 的列式结果是什么,组内去心平均化之后怎么再体现每个行业的差别,组内去心的结果如何解释?
- Q70.实证研究中被解释变量是面板数据,核心解释变量是时间序列数据,比如用我国 GDP 对上市公司的某个财务指标做回归,这样得到 GDP 的回归系数可信吗(其他层面主要影响因素已放入控制变量)?
- Q71.第 4 讲中 1579 行,下面回归结果中 union 怎么出来的?在这种情形下,怎么引用系数(如 D、D#c.hours 的系数)?使用 \_b[x1] 的方法好像行不通了
- Q72.做双固定效应模型时,加入 i.year 效果差,改为加入时间趋势项 t 后回归效果稍好但仍不佳,尝试加入时间 t 和个体效应 dummy 的乘积之后效果不错,这样操作可以吗?
- Q73.请问老师 `R square` 和 `Pseudo R square` 的区别是什么?如何解释呢?
- Q74.根据老师所讲内容,面板数据当中最好直接用 `FE` ,即使没有通过`Hausman Test`?主要是文献中看到很多还是进行 `Hausman Test` ,然后用 `RE` 的。
- Q75.实证回归发现解释变量和被解释变量呈现显著的 U 型关系,但是如果后面发现我们的数据样本区间仅仅覆盖了 U 型右侧的一部分区间,是否意味着我们基于这样的数据样本估计得到的 U 型关系是不可信的?
- Q76. `i.id`和命令语 `fe` 是一样的是吗,那么 `i.year` , `fe` 也可以是双向固定的写法吗。还有请问老师能讲一下聚类调整和固定效果模型的差异和使用吗?
- Q77. 面板数据分析中,时间趋势项和时间效应可以同时加入吗?
- Q78. 麻烦连老师讲讲 5.4 内生性问题和 IV 估计吧,投稿时,很多审稿专家都会提出这方面的问题,谢谢。
- Q79. 在固定效应模型中,解释变量年度人均 GDP,有很强的时间序列相关,加入时间固定效应后就不显著。请问这时还需要一定加入时间固定效应吗?如果要加,应该怎么处理?
- Q80. 老师,在跑 logit 回归的时候,经常会删掉好多诸如行业和年度的虚拟变量,是什么原因导致的呢?
- Q81. 老师,在控制行业后,再控制个体固定效应,行业一般都会被 omit,我可以理解为是个体层面的固定效应把行业吸收掉了吗?
- Q82. xtreg lnFVC lnPCDI lnheight lnweight P90 P97 P07 yr\*, fe robust 请教连老师,1、做人均可支配收入对肺活量的影响,1985-2014 年的 31 个省的面板数据,其中学校体育课层面的数据无法获得,我可以讲 1990,1997,2007 年的学校体育学的三条有实质性措施的政策作为学校体育课层面的工具变量吗?2 以上三大政策既是学校体育的工具变量,也可以作为时间效应的控制,在论文可以这样描述吗? 3 我已经做了三大政策作为时间效应的控制,但是有些审稿人还要求做时间效应的控制,那么可以放入时间虚拟变量,然后将和三大政策产生共线性的时间虚拟变量删除,只保留部分,请问可以这样处理吗?
- Q83. 请问 i.year i.indcd,vce(cluster id)这种写法合理吗 没有服从您说的最高层级去 cluster 但是现在很多也有这样用的 请问有问题吗?
- Q84. 老师,固定效应模型里边加入 SOE(国企还是非国企),会被删掉。但为什么我读有的论文,SOE 的回归结果是正常的呢?是我们数据结构不同,别人的 SOE 数据可能是随时间变化的,比如国企混改...
- Q85. 请教连老师,如果做宏观经济对身体素质的影响,不对原始数据进行处理,例如取对数之类的,而是直接对原始数据做刀切法和自抽样法,这样可以吗,得出的结果也是稳健的对吗?谢谢连老师。