早期机器学习一般来说都是概率图模型(PGM),概率图模型分为
1.有向图模型,也称为贝叶斯网(BayesianNetwork,BN),其网络结构使用有向无环图;其可以显示出一个变量是否是另外一个变量的先验。
2.无向图模型,也称为马尔可夫网(MarkovNetwork,MN),其网络结构为无向图;其只能说明二者存在联系。
3. 局部有向模型,即同时存在有向边和无向边的模型,包括条件随机场(ConditionalRandomField,CRF)和链图(ChainGraph)。
现在很少有人研究概率图模型了,因为概率图首先要有专家来做出概率图才能进行研究,如果想强行数据驱动得出依赖关系,但对数据质量提出较高要求,误差较大。
概率图模型主要是为了解决维度灾难:当有n个变量是,如果用列举法,就会有2^n项才能得出联合概率分布,而如果用概率图模型,可以用如下公式得出概率分布,如:
常见的概率图模型有
- 朴素贝叶斯
- 马尔科夫链
- 隐马尔科夫模型(HMM)
其中xi为隐变量,yi为现象,例如股票预测,已知y1,y2,y3为牛市熊市牛市求此时x3是牛市的概率。