微积分部分略
线性代数
概率部分
- 以数据集grilic.dta为例
无条件
use grilic.dta,clear
describe
sum //查看各个变量的基本统计指标
sum lnw,detail //可以看lnw的更多统计指标,比如偏度、峰度
hist lnw,width(0.1) //lnw直方图,不连续
//“kdensity”表示核密度估计(kernel density estimation)
//选择项“normal”表示正态分布的密度函数作为对比
//选择项“normop(lpattern(dash))”表示是将正态密度用虚线(dash)来画
//normop表示normal options;lpattern表示line pattern,简写lp
kdensity lnw,normal normop(lpattern(dash))
//查看工资水平本身的分布,想去正态分布甚远,非对称分布,在右边存在很长的尾巴,向右偏
kdensity wage
有条件
kdensity lnw if s==16
//把lnw无条件密度与条件密度画在一起,两种表示
twoway kdensity lnw||kdensity lnw if s==16,lpattern(dash)
twoway (kdensity lnw)(kdensity lnw if s==16,lpattern(dash))
//s=16的工资对数条件密度比无条件密度向右移,条件期望增大,条件方差变小
迭代期望定律
随机变量无关的三个层次概念
正态分布
normalden(x) //标准正态概率密度
normal(x) //标准正态分布函数
twoway function y=normalden(x),range(-5 5) xline(0) ytitle(概率密度)
normalden(x,m,s) //一般正态分布,m是期望,s是标准差
//将N(0,1)与N(1,4)的密度函数画在一起
twoway function y=normalden(x),range(-5 10)||function z=normalden(x,1,2),range(-5 10) lpattern(dash) ytitle(概率密度)
多维正态分布
卡方分布
chi2den(k,x) //概率密度
chi2(k,x) //分布函数
//卡方(3)与卡方(5)
twoway function chi3=chi2den(3,x),range(0 20)||function chi5=chi2den(5,x),range(0 20) lpattern(dash) ytitle(概率密度)
t分布
tden(k,t) //概率密度
t(k,t) //分布函数
//t1与t5
twoway function t1=tden(1,x),range(-5 5)||function t5=tden(5,x),range(-5 5) lpattern(dash) ytitle(概率密度)
F分布
Fden(k1,k2,x) //概率密度
F(k1,k2,x) //分布函数
//F(10,20)与F(10,5)
twoway function F20=Fden(10,20,x),range(0 5)||function F5=Fden(10,5,x),range(0 5) lpattern(dash) ytitle(概率密度)
t分布的平方是F分布
统计推断思想
计量经济学的主要方法是数理统计的统计推断(statistical inference)。
称我们感兴趣的研究对象全体为总体(population),其中的每个研究对象称为个体(individual)。
由于总体包含的个体可能很多,普查成本较高,故常从总体抽取部分个体,称为样本(sample)。
样本所包含的个体数目称为样本容量(sample size)。
通常希望样本为随机样本(random sample),即总体中的每位个体都有相同的概率被抽中,且被抽中的概率相互独立,称为独立同分布(independently identically distributed,简记iid)。
统计推断就是根据样本数据,对总体性质进行推断的科学。【由样本推总体】
统计推断的主要形式有参数估计(点估计、区间估计)、假设检验及预测等,其中点估计为统计推断的基础。