Log-linear Models

最新推荐文章于 2023-12-01 16:03:10 发布

咆哮蜗牛

最新推荐文章于 2023-12-01 16:03:10 发布

阅读量2k

点赞数

分类专栏：数学机器学习文章标签：数学统计学 Log-linear 凹函数

机器学习同时被 2 个专栏收录

18 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

Log-linear模型广泛用于NLP分类任务中。Log-linear模型给出观察对象/标记输出(observation/label)对一个联合概率，其中(x, y)∈X×Y：

(1)

其中是一个实值特征权重向量，是特征函数：(x,y)——>实数特征向量。

下面讲解Log-linear的特性。

假设有训练集，那么权重向量为

(5)式是凹函数(concave)，可以得到仅有的一个最大值。

更多的，我们计算给出观察对象的的前提下，得到标记输出的条件概率；一个样例(x,y)，对应的条件概率为：

训练条件Log-linear模型等价于最大化条件概率（6式）乘积：

(9)式是凹函数的证明：

(10)

(10)式对求偏导后得到：

(11)

则梯度为：

(12)

进一步可以得到二阶偏导数：

(13)

则二阶偏导数组成的海森矩阵(Hessian Matrix)是一个带符号的协方差矩阵，而协方差矩阵是半正定矩阵。而海森矩阵为半正定阵，则目标函数是一个凹函数。

由上可知Log-linear模型中的目标函数是一个凹函数，可以用爬山算法(hill-climbing)来得到最大值。应该也可以用梯度上升算法来得到最大值。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Log-linear Models

Log-linear模型广泛用于NLP分类任务中。Log-linear模型给出观察对象/标记输出(observation/label)对一个联合概率，其中(x, y)∈X×Y： (1) 其中是一个实值特征权重向量，是特征函数：(x,y)——>实数特征向量。下面讲解Log-line
复制链接

扫一扫

专栏目录

咆哮蜗牛 CSDN认证博客专家 CSDN认证企业博客

码龄15年

45: 原创

6万+: 周排名

2万+: 总排名

19万+: 访问

: 等级

2349: 积分

192: 粉丝

45: 获赞

20: 评论

109: 收藏

私信

关注

热门文章

分类专栏

最新评论

Log-linear Models
qq_45862663: 楼主你好，我想请教一下实值的特征权重向量选择后的特征值是原始样本数据嘛？我的想法是选择原始数据（m维）中对应特征权重向量中权值前n大的n维特征，这样来实现降维却发现效果十分不理想……是我理解错了吗？
深层置信网的快速学习方法（Deep Learning）
qq_47599081: 怎么看不见？
linux出现tmp空间满的情况解决
java程序员0.0: 跟着做了以后原来的/tmp文件夹还是一直在增长,原来的1M还是一下子就满了
linux出现tmp空间满的情况解决
java程序员0.0: 创建完文件夹执行完下面的命令export TMPDIR=/mnt/kernelsrc/tmp怎么生效呢
费马小定理——从素数判定到RSA公钥加密体制
weixin_43420446: 费马小定理的归纳法证明和应用 https://packetmania.github.io/2021/02/14/Fermats-Little-Theorem

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。