智能问答-深度学习--第一章统计学习数学基础

_Mr_Zhang_

于 2019-10-11 10:41:06 发布

阅读量221

点赞数

分类专栏：智能问答

本文链接：https://blog.csdn.net/u014365133/article/details/102480063

版权

2 篇文章 0 订阅

订阅专栏

在这里插入图片描述

-极大似然估计算法

在这里插入图片描述

最大似然估计的一般步骤为：
1.写出似然函数
2.对似然函数取对数得到对数似然函数
3.求对数似然函数的关于参数组的偏导数，并令其为0，得到似然方程组
4.解似然方程组，得到参数组的值

极大似然估计算法vs贝叶斯
1.估计的参数不同
2.是否认为参数的所有可能取值都是一样的
3.是否引入先验概率

其中X 代表一个离散型随机变量

联合熵：体现随机变量X和Y共同携带的信息量

在这里插入图片描述
其中p（x,y）是随机变量x和y的联合分布

条件熵：一直一个随机变量，另一个随机变量的熵的计算

在这里插入图片描述

相对熵：两个随机分布之间距离的度量
在这里插入图片描述
其中p和q是两个概率分布

互信息：随机变量X的熵，在给定随机变量Y的条件熵后的缩减量
在这里插入图片描述

最大熵模型
最大熵就是使得系统处于熵最大时的状态— 满足已有事件，无偏地对待不确定时间，即对未确定的时间认为是等概率出现的

其中～P（x）是先验概率，P（y|x）是条件概率

在模型集合C中保证H（P）最大的模型被称为最大熵模型
在这里插入图片描述

拉格朗日乘子法

在最大熵求解问题中，应用拉格朗日乘子，此时损失函数对应的拉格朗日函数L（P，W）为
在这里插入图片描述

求L（P，w）关于P（y|x）的偏导数，并令其等于0
在这里插入图片描述
又有
因此两式子联立可得到的最大熵模型的公式

其中z为规范化的因子，定义为

向量表示
数据集
训练集，测试集，验证集
统计学习三要素
模型（生成模型：朴素贝叶斯，隐马尔科夫模型判别模型：k近邻法，决策树，线性回归，逻辑蒂斯回归，SVM，神经网络等）
策略（0-1损失函数，平方损失函数，对数损失函数）
算法算法是使用开发测试集数据学习模型参数，网络的具体办法，也有可能在开发测试集之外借助于其他数据