神经网络语言模型

最新推荐文章于 2024-03-06 22:55:42 发布

JepsonWong

最新推荐文章于 2024-03-06 22:55:42 发布

阅读量1k

点赞数

分类专栏：自然语言处理文章标签：神经网络语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013710265/article/details/65633670

版权

自然语言处理专栏收录该内容

3 篇文章 0 订阅

订阅专栏

基于计数的n-gram语言模型：出现的问题：（1）数据稀疏，有些数据未出现过（2）忽略语义的相关性，如“无聊”与“枯燥”虽然语义相似，但无法共享信息。词语表示为：one-hot表示法。基于分布式表示的n-gram语言模型：出现的问题：（1）词向量：如何将每个词映射到实数向量空间中的一个点（2）f函数的设计：设置什么样的神经网络结构模拟f函数词语表示为：基

摘要由CSDN通过智能技术生成

基于计数的n-gram语言模型：

出现的问题：

（1）数据稀疏，有些数据未出现过

（2）忽略语义的相关性，如“无聊”与“枯燥”虽然语义相似，但无法共享信息。

词语表示为：one-hot表示法。

基于分布式表示的n-gram语言模型：

出现的问题：

（1）词向量：如何将每个词映射到实数向量空间中的一个点

（2）f函数的设计：设置什么样的神经网络结构模拟f函数

词语表示为：基于连续空间的词语表示。

词表规模V和词向量维度D如何确定：

–V的确定：1：训练数据中所有词；2：频率高于某个阈值的所有词；3：前V个频率最高的词。

–D的确定：超参数，人工设定，一般从几十到几百。

如何学习L：

–通常先随机初始化，然后通过目标函数优化词的向量表达（e.g.最大化语言模型似然度）。

语言模型：前馈神经网络

问题：

仅对小窗口的历史信息建模。例如5-gram语言模型，仅考虑前面4个词的历史信息。

能否对所有的历史信息进行建模，即第t个词的语言模型概率依赖于所有前t-1个词。

语言模型：循环神经网络

输入：t- 1时刻的历史与t时刻的输入。

输出：t时刻的历史与下一时刻t+1输入yt的概率。

问题：

梯度消失和爆炸：所以要有选择地保留和遗忘

语言模型：长短时记忆网络LSTM

词向量规模、词向量分布

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
神经网络语言模型

基于计数的n-gram语言模型：出现的问题：（1）数据稀疏，有些数据未出现过（2）忽略语义的相关性，如“无聊”与“枯燥”虽然语义相似，但无法共享信息。词语表示为：one-hot表示法。基于分布式表示的n-gram语言模型：出现的问题：（1）词向量：如何将每个词映射到实数向量空间中的一个点（2）f函数的设计：设置什么样的神经网络结构模拟f函数词语表示为：基
复制链接

扫一扫

专栏目录

JepsonWong CSDN认证博客专家 CSDN认证企业博客

码龄10年

100: 原创

17万+: 周排名

188万+: 总排名

33万+: 访问

: 等级

4099: 积分

110: 粉丝

74: 获赞

9: 评论

373: 收藏

私信

关注

热门文章

分类专栏

计算机系统结构 17篇
人工智能 1篇
机器学习 24篇
神经网络 1篇
自然语言处理 3篇
大数据 15篇
python 9篇
C++ 2篇
Java 3篇
Scala 7篇
Linux 12篇
线性代数 2篇
科学计算 2篇
最优化理论 1篇
开源硬件 9篇
算法 2篇
网络 9篇
TensorFlow 1篇
汇编语言 2篇
安全 1篇
其他 1篇

最新评论

特征工程（补充）--特征组合
Bullet@: 可以具体谈谈是怎么样让特征加减乘除组合的吗？
sklearn：点互信息和互信息
weixin_41980031: 补充说明点互信息也可以通过Sklearn的build in function 来写代码如下 [code=python] from sklearn import feature_selection as fs # xtrain是features # ytrain是labels # 返回的是一个每个features的PMI值的matrix PMI = fs.mutual_info_classif(xtrain,ytrain) [/code]
sklearn：点互信息和互信息
weixin_41980031: 补充说明点互信息也可以通过Sklearn的build in function 来写代码如下 [code=python] from sklearn import feature_selection as fs # xtrain是features # ytrain是labels # 返回的是一个每个features的PMI值的matrix PMI = fs.mutual_info_classif(xtrain,ytrain) [/code]
sklearn：点互信息和互信息
weixin_41980031: 补充说明点互信息也可以通过Sklearn的build in function 来写代码如下 [code=python] from sklearn import feature_selection as fs # xtrain是features # ytrain是labels # 返回的是一个每个features的PMI值的matrix PMI = fs.mutual_info_classif(xtrain,ytrain) [/code]
人工智能三要素
m0_49510957: 无限超级人工智能机器人可以帮助全人类获得无限算能造器来完成全人类的不死永生与无限飞穿！……………

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。