Econometrics/Stata再学习(一)

Tips:

1)For large data: set memory

2)price index:长时间数据要注意平价

3)在做调查之前,一定要先思考想要什么样的图(是否又方差差异、大体趋势的形式),再去设计问卷问题/调查策略。

从相关性到因果关系

1)covariance的意义:注意从定义式理解cov(X,Y)=E[(Y-EY)(X-EX)](从象限意义理解)

        property1:x和y相互独立,则cov=0。逆命题不成立!

        property2:any…

corr x1 x2, cov

2)corr的意义:可以消除量纲,把二者关系界定在-1和1之间

corr x1 x2 x3

3)Pearson correlation:

4)Spearson correlation:

5)注意经济含义,数据上相关≠经济上相关

gr matric x1 x2 x3        #画出一个多变量相关关系的图

twoway (scatter y x) (lfit y x)        #在一张图中同时画出散点图和预测线linear prediction plot

Sampling distribution

  • 数据中进行抽样,即可得到βi_hat的分布(中心极限定理),从而确定βi_hat是否显著不为0.

OLS estimates

  • 最小二乘法,令ei的平方和最小
  • 残差的概念/残差的估计的概念:y=β0_hat+β1_hat·x+u_hat,u_hat是不能被自变量捕捉的信息(能体现个体的差异),但是uhat的mean极小。
  • 拟合优度R^2=SSE/SST:越接近1说明分布越相似(ps: SST=SSE+SSR,此时已有假设)
    • 数据离散程度极高的时候(微观较多),很难出现接近于1的R^2
    • SST (total sum of squares)为总平方和,SSR (regression sum of squares)为回归平方和,SSE (error sum of squares) 为残差平方和

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值