数据
数据是计量经济学模型的基础
数据的形式:数字、文字、图像
数据类型
- 文字->定性数据
- 数值->定量数据
数据与时间的关系
时间序列:对同一个观测单位,在不同时点的多个观测值构成的观测值序列
观测对象:我国 -研究对象是唯一的
时间:区间
时间间隔:相邻的两个数据之间相差的时间
相差一年:年度时间序列
不同时间序列性质有差异。在运用时间序列数据时,应根据具体情况选择数据种类(年度、季度、月度)
截面数据:在同一时点上,对不同观测单位观测得到的多个数据构成的数据集
观测对象:多个
时间:唯一
截面数据的时间是凝固的
例如:2012我国各省的GDP
面板数据(三维):时间序列数据(二维)+界面数据(二维)
样本数据的质量
准确性,完整性,…
数据的计量尺度
定类尺度
按照客观现象的某种属性对其进行分类。数值是作为各种分类的代码,并不反应各类的优劣、量的大小或顺序
计量层次最低
对事物进行平行的分类
使用时必须符合类别穷尽
和互斥
的要求(并之后是全集,交之后是空集)
例:男生女生;赤橙黄绿青蓝紫
定序尺度
定序尺度是对客观现象各类之间的等级差或顺序差的一种测度
如:金银铜牌;学生成绩优良中差
定距尺度
定距尺度是对现象或类别的…测度
如:温度
定比尺度
反映比重、速度、数量
如:人均GDP;经济增长率
时点(人口数)、时期(国内生产总值)
模型需要检查的问题:
序列相关 多重共线性 异方差…?
变量的定义
消费模型c=a+βy+μ
变量是数据集合的名称。通过对变量名的引用,可以简便地对数据集合进行处理
单变量的统计描述
偏度:度量了分布的不对称性
峰度:
经济变量
经济变量是随机变量。随机变量是驱逐具有随机性的变量
宏观经济变量 微观经济变量
流量 存量
派生变量
特殊变量
使用虚拟变量,把定性数据定量化
如:男生女生
本期变量 滞后变量
经济变量之间的关系
- 没有关系
- 相关关系
- 因果关系
- 相互影响关系
- 恒等关系
有关系 没关系:r
相关系数没有单位,有正负号:正相关/负相关
r的取值:
0-0.3不相关 0.3-0.5若 0.5-0.8中 0.8-1强
单向因果 互为因果:granger因果检验
恒等关系 Y=C+I+P+…?
参数的定义和分类
- 显含参数:与变量相乘的常系数
- 隐含参数:随机干扰项的概率分布
随机方程:方程中含有随机干扰项
(消费模型)y=a+βx+μ
-> 最小二乘法 最大或然法 -> 确定性方程y^=110+0.7x