目标和背景
目标:使用主成分分析来挖掘美国国债利率期限结构数据的特征。
数据:一共有
236
条记录,对应
236
个月份,每条记录是一个
8
维向量。
解决方案和程序
a.
对所有利率曲线和利率曲线的均值
作图
:
![](https://img-blog.csdnimg.cn/e5b1d0b48e6f499e8dcb4614a1714462.png)
Figure:
(a)
利率曲线;
(b)
利率曲线均值;
利率均值大致上随着期限的增大而增大,由短期平均利率的约
4%
逐
渐增大到
10
年期平均利率
5.5%
。
b.
使用
主成分分析
来进一步挖掘数据的特征
I
第一主成分:数值都是负数,绝对值随期限增大而减少,反映了数据
对均值的偏离程度。
I
第二主成分:随期限增大由正变负,反映利率倒挂现象的严重程度。
I
前两个主成分已经解释了数据总方差的
99.6%
。
c.
使用第一主成分
重构数据
并对比原始数据,能比较直观地看出,主成分分
析作为一种数据平滑方法的平滑效果。
![](https://img-blog.csdnimg.cn/b0a86e16353f4957a57446cee1381e07.png)
Figure:
(a)
利率曲线;
(b)
利率曲线均值;
(c)pc1,2
;
(d)pc1
的数据重构。
机器学习与
python
实践
()
第三章 无监督学习基础
人民邮电出版社
30 / 42