//help psmatch2//帮助文件
/*——————————————————————————————————————————————————————————————————————————————————————————————————————————————*
clear
insheet using C:\Users\Administrator\Desktop\本科生论文\2、漫画可持续使用\manhua_screen.csv
save C:\Users\Administrator\Desktop\本科生论文\2、漫画可持续使用\manhua_screen.dta
use C:\Users\Administrator\Desktop\本科生论文\2、漫画可持续使用\manhua_screen.dta
** 将数据随机排序
set seed 10101
gen ranorder = runiform()
sort ranorder //(以上两步对所有观测值进行随机排序)/ssc install psmatch2//安装
*(一)*描述统计
*(1)(描述统计1,(与R语言一致,比较好用),tabstat是输出描述性统计非常好用的命令。
asdoc tabstat self_hly objtv_hly ifinternet gender age huji edu lnincome_fam a36 v458 class east west , s(count mean median sd min max)
*(描述统计2 ,summarize命令可以得出所有处理过的变量的平均值
asdoc summarize
**描述统计(百分比)(漫画APP)
tab sex age edu zhiye ifuse useage usefre usetime
graph bar (count) ,over (sex)
graph pie,over(sex)
**(2)参数检验:T检验(均值检验),t检验中的x只有两类
ttest usefre,by (edu)
**(3)方差分析(usetime 是因变量, age等是影响因素,)
*3.1单因素方差分析(只能看组间区别)(Prob>chi2=0.000)
oneway useage sex,tabulate
**3.2多因素方差分析
anova useage zhiye
**(4) 相关性分析
pwcorr self_hly ifinternet gender age huji edu lnincome_fam a36 v458 class east west , sig
**(6)列联表
tabulate age usefre, chi2 column row cell nolabel missing
*——————————————————————————————————————————————————————————————————————————————————————————————————————————————*
//一些说明:a.处理变量t为“核心解释变量”(hlw二分类变量),协变量为自变量,结果变量为“因变量”a36//
//b. logit use logit instead of the default probit to estimate the propensity score。因此,不使用logit则为probit算法。
**一、匹配方法
**1.近邻匹配:指定按照1:1进行匹配,如果要按照1:3进行匹配,则设定为neighbor(3)
**(1)卡尺内最近邻匹配
asdoc psmatch2 ifinternet gender age huji edu lnincome_fam a36 v458 class ,outcome(self_hly) n(3) cal(0.01) ate ties common
asdoc pstest gender age huji edu lnincome_fam a36 v458 class ,both
**(2)k近邻匹配法,元数为4
asdoc psmatch2 ifinternet gender age huji edu lnincome_fam a36 v458 class,outcome(self_hly) ate n(4) common ties
asdoc pstest gender age huji edu lnincome_fam a36 v458 class,both
**(3)最近邻匹配n(1) ;一对一匹配(无放回)
psmatch2 ifinternet gender age huji edu lnincome_fam a36 v458 class,outcome(self_hly) logit ate n(1) common ties quietly noreplacement
pstest gender age huji edu lnincome_fam a36 v458 class,both
**2.半径匹配:大多数一对四匹配发生在卡尺0.01范围内,不存在太远的近邻,进行半径(卡尺)匹配
asdoc psmatch2 ifinternet gender age huji edu lnincome_fam a36 v458 class,outcome(self_hly) radius cal(0.01) ate ties logit common quietly
asdoc pstest gender age huji edu lnincome_fam a36 v458 class,both
**3.核匹配:
psmatch2 ifinternet gender age huji edu lnincome_fam a36 v458 class,outcome(self_hly) kernel ate ties logit common quietly
pstest gender age huji edu lnincome_fam a36 v458 class,both
**4、马氏匹配
psmatch2 ifinternet, outcome(self_hly) mahal(gender age huji edu lnincome_fam a36 v458 class) n(4) ai(4) ate
pstest gender age huji edu lnincome_fam a36 v458 class,both
**5.局部线性回归匹配
psmatch2 ifinternet gender age huji edu lnincome_fam a36 v458 class,outcome(self_hly) llr ate ties logit common quietly
pstest gender age huji edu lnincome_fam a36 v458 class,both
**6.条匹配
psmatch2 xmt2 gender age hunyin huji a64 edu a15 a17 a35,outcome(a36) spline
**二、both命令
pstest gender age hunyin huji a64 edu a15 a17 a35,both graph
**三、ATT平均处理效应(上述步骤未显示ATT标准误,采用自助法得到标准误)
set seed 2019
bootstrap r(att) r(atu) r(ate),reps(50):psmatch2 xmt2 gender age huji edu lnincome_fam v458 a36 class,outcome(a36) llr ate ties logit common quietly
*——————————————————————————————————————————————————————————————————————————————————————————————————————————————*
**四、内生性(工具变量)
*(2)ivreg2命令(ivreg2命令会直接报告Cragg-Donald Wald F 统计量和Kleibergen-Paap Wald rk F统计量两个用于弱工具变量检验的统计量)
ivreg2 a15 (ifinternet=ifmessage) gender age huji edu lnincome_fam a36 class east west , first
*(3)【重要】2SLS方法: https://zhuanlan.zhihu.com/p/361542234 *第一阶段:从表中可以看出,工具变量xiaoxi的系数为0.4047,标准误为0.008,在1%的水平上显著。
*第二阶段:从表中可以看出,hlw的系数为0.410,标准误为0.054,在1%的水平上显著。//回归结果与R语言得出的一致。
ivregress 2sls self_hly (ifinternet=hlwpj17) gender age huji edu lnincome_fam a36 v458 class east west, first
estat firststage,forcenonrobust
*弱工具变量检验
*(偏R平方为0.1617,说明工具变量xiaoxi对内生变量hlw有很强的解释力度。)
*F统计量= 2034.96 >10,根据经验准则可以判断,我们的工具变量不是一个弱工具变量。
*只有一个工具变量,也没法做过度识别检验。
ivregress 2sls objtv_hly (ifinternet=ifmessage) gender age huji edu lnincome_fam a36 v458 class east west, first
estat firststage,forcenonrobust
*——————————————————————————————————————————————————————————————————————————————————————————————————————————————*
**五、二元logistic回归模型
logistic self_hly ifinternet gender age huji edu lnincome_fam a36 v458 class east west
*输出结果到word,安装外部命令asdoc。
*ssc install asdoc, replace
*——————————————————————————————————————————————————————————————————————————————————————————————————————————————*
**六、因子分析https://zhuanlan.zhihu.com/p/281278580
clear
use D:\ⅡR+Stata\statawork\merge_elderly.dta
*查看数据
des
*search factortest 安装命令
*destring _all,replace force **转换所有数据格式
*KMO一般0.6以上比较合适。
factortest a301 a302 a303 a304 a305 a306 a307 a308 a309 a3010 a3011
*相关性分析
pwcorr a301 a302 a303 a304 a305 a306 a307 a308 a309 a3010 a3011 a3012
*PCA主成份分析
pca a301 a302 a303 a304 a305 a306 a307 a308 a309 a3010 a3011
*PCF, principle component factors,主成份因子法分析
*因子载荷矩阵中,某个变量的Uniqueness值如果大于0.6就不太正常,可能需要剔除
factor a301 a302 a303 a304 a305 a306 a307 a308 a309 a3010 a3011 , pcf blank(0.50)
factor d21_4__1 d21_4__2 d21_4__3 d21_4__4 d21_4__5 d21_4__6 d21_4__7 d21_4__8 d21_4__9 d21_4__10 d21_4__11,factors(4),pcf
*因子旋转(必须要旋转)
rotate ,detail blanks (0.50)
*可视化
loadingplot, factors(2) yline(0) xline(0)
漫画app分析
最新推荐文章于 2024-04-21 17:14:46 发布