漫画app分析

//help psmatch2//帮助文件
/*——————————————————————————————————————————————————————————————————————————————————————————————————————————————*
  
clear

insheet using C:\Users\Administrator\Desktop\本科生论文\2、漫画可持续使用\manhua_screen.csv
save  C:\Users\Administrator\Desktop\本科生论文\2、漫画可持续使用\manhua_screen.dta   
use  C:\Users\Administrator\Desktop\本科生论文\2、漫画可持续使用\manhua_screen.dta 


** 将数据随机排序
set seed 10101
gen ranorder = runiform()
sort ranorder  //(以上两步对所有观测值进行随机排序)/ssc install psmatch2//安装
 
   *(一)*描述统计
 *(1)(描述统计1,(与R语言一致,比较好用),tabstat是输出描述性统计非常好用的命令。
 asdoc  tabstat self_hly objtv_hly   ifinternet gender age huji edu lnincome_fam a36 v458 class east west , s(count mean median sd min max)
 
*(描述统计2 ,summarize命令可以得出所有处理过的变量的平均值
 asdoc  summarize
 
 **描述统计(百分比)(漫画APP)
 tab  sex age edu zhiye ifuse  useage  usefre usetime
 graph bar (count) ,over (sex)
graph pie,over(sex)
 
**(2)参数检验:T检验(均值检验),t检验中的x只有两类
ttest usefre,by (edu)
  
**(3)方差分析(usetime 是因变量, age等是影响因素,)
*3.1单因素方差分析(只能看组间区别)(Prob>chi2=0.000)
oneway   useage sex,tabulate 

**3.2多因素方差分析
  anova useage  zhiye 
  
**(4) 相关性分析
  pwcorr  self_hly  ifinternet gender age huji edu lnincome_fam a36 v458 class east west , sig
  
**(6)列联表
tabulate  age usefre, chi2 column row cell nolabel missing

  *——————————————————————————————————————————————————————————————————————————————————————————————————————————————*
//一些说明:a.处理变量t为“核心解释变量”(hlw二分类变量),协变量为自变量,结果变量为“因变量”a36//
//b. logit use logit instead of the default probit to estimate the propensity score。因此,不使用logit则为probit算法。

**一、匹配方法
**1.近邻匹配:指定按照1:1进行匹配,如果要按照1:3进行匹配,则设定为neighbor(3)
**(1)卡尺内最近邻匹配
asdoc psmatch2 ifinternet gender age   huji  edu lnincome_fam  a36 v458 class ,outcome(self_hly) n(3) cal(0.01) ate ties   common   
asdoc pstest gender age   huji edu lnincome_fam  a36  v458 class ,both
 
**(2)k近邻匹配法,元数为4
asdoc psmatch2 ifinternet gender age   huji edu lnincome_fam  a36 v458  class,outcome(self_hly)  ate n(4) common  ties  
 asdoc pstest gender age   huji edu lnincome_fam  a36 v458  class,both
 
**(3)最近邻匹配n(1) ;一对一匹配(无放回)
psmatch2 ifinternet gender age   huji edu lnincome_fam  a36  v458  class,outcome(self_hly) logit ate n(1) common  ties quietly  noreplacement  
 pstest gender age   huji edu lnincome_fam  a36  v458 class,both

**2.半径匹配:大多数一对四匹配发生在卡尺0.01范围内,不存在太远的近邻,进行半径(卡尺)匹配
asdoc  psmatch2 ifinternet gender age   huji edu lnincome_fam  a36  v458 class,outcome(self_hly) radius cal(0.01) ate ties logit  common quietly  
asdoc  pstest gender age   huji edu lnincome_fam  a36 v458  class,both
 
**3.核匹配:
psmatch2 ifinternet gender age   huji edu lnincome_fam  a36 v458  class,outcome(self_hly) kernel ate ties logit common quietly  
 pstest gender age   huji edu lnincome_fam  a36 v458  class,both
 
**4、马氏匹配
psmatch2 ifinternet, outcome(self_hly) mahal(gender age   huji edu lnincome_fam  a36  v458 class) n(4) ai(4) ate  
 pstest gender age   huji edu lnincome_fam  a36 v458  class,both
 
**5.局部线性回归匹配
 psmatch2  ifinternet gender age  huji edu lnincome_fam  a36  v458 class,outcome(self_hly) llr ate ties logit common  quietly  
 pstest gender age  huji edu lnincome_fam  a36 v458  class,both
 
**6.条匹配
psmatch2 xmt2 gender age hunyin huji a64 edu a15 a17 a35,outcome(a36) spline

**二、both命令
 pstest gender age hunyin huji a64 edu a15 a17 a35,both graph    


 **三、ATT平均处理效应(上述步骤未显示ATT标准误,采用自助法得到标准误)

set seed 2019
bootstrap r(att) r(atu) r(ate),reps(50):psmatch2 xmt2 gender age   huji edu lnincome_fam v458 a36 class,outcome(a36) llr ate ties logit common quietly

  *——————————————————————————————————————————————————————————————————————————————————————————————————————————————*
**四、内生性(工具变量)

*(2)ivreg2命令(ivreg2命令会直接报告Cragg-Donald Wald F 统计量和Kleibergen-Paap Wald rk F统计量两个用于弱工具变量检验的统计量)
  ivreg2 a15 (ifinternet=ifmessage) gender age   huji edu lnincome_fam  a36 class east west , first
  
  
  *(3)【重要】2SLS方法: https://zhuanlan.zhihu.com/p/361542234 *第一阶段:从表中可以看出,工具变量xiaoxi的系数为0.4047,标准误为0.008,在1%的水平上显著。
 *第二阶段:从表中可以看出,hlw的系数为0.410,标准误为0.054,在1%的水平上显著。//回归结果与R语言得出的一致。
  ivregress 2sls self_hly (ifinternet=hlwpj17) gender age   huji edu lnincome_fam  a36 v458 class east west, first   
  
  estat firststage,forcenonrobust
    *弱工具变量检验
  *(偏R平方为0.1617,说明工具变量xiaoxi对内生变量hlw有很强的解释力度。)
  *F统计量= 2034.96 >10,根据经验准则可以判断,我们的工具变量不是一个弱工具变量。
  *只有一个工具变量,也没法做过度识别检验。

    ivregress 2sls objtv_hly (ifinternet=ifmessage) gender age   huji edu lnincome_fam  a36 v458 class east west, first   
  
  estat firststage,forcenonrobust

    *——————————————————————————————————————————————————————————————————————————————————————————————————————————————*
**五、二元logistic回归模型
logistic self_hly ifinternet gender age   huji edu lnincome_fam  a36  v458 class east west

*输出结果到word,安装外部命令asdoc。
*ssc install asdoc, replace

  *——————————————————————————————————————————————————————————————————————————————————————————————————————————————*
**六、因子分析https://zhuanlan.zhihu.com/p/281278580
clear 
use  D:\ⅡR+Stata\statawork\merge_elderly.dta 

*查看数据
des 

*search factortest 安装命令
 *destring _all,replace force  **转换所有数据格式
 *KMO一般0.6以上比较合适。
factortest a301 a302 a303 a304 a305 a306 a307  a308  a309  a3010  a3011   

*相关性分析
pwcorr a301 a302 a303 a304 a305 a306 a307  a308  a309  a3010  a3011   a3012

*PCA主成份分析
pca  a301 a302 a303 a304 a305 a306 a307  a308  a309  a3010  a3011    

*PCF, principle component factors,主成份因子法分析
*因子载荷矩阵中,某个变量的Uniqueness值如果大于0.6就不太正常,可能需要剔除
factor a301 a302 a303 a304 a305 a306 a307  a308  a309  a3010  a3011  , pcf blank(0.50)

factor d21_4__1 d21_4__2 d21_4__3 d21_4__4 d21_4__5 d21_4__6 d21_4__7 d21_4__8 d21_4__9 d21_4__10 d21_4__11,factors(4),pcf

*因子旋转(必须要旋转)
rotate ,detail blanks (0.50)

*可视化
loadingplot, factors(2) yline(0) xline(0) 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值