Trm理论

我.佛.糍.粑

已于 2024-09-04 01:34:34 修改

阅读量441

点赞数 4

文章标签：自然语言处理笔记人工智能

于 2024-07-16 04:52:05 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_81989837/article/details/139707390

版权

预训练

一个模型a和一个模型b，a是已经训练好的，a和b是解决相似问题，a和b的浅层神经网络很像，因此直接对b使用a的浅层神经网络，使得b不需要太多的数据，解决了b数据不够的问题

统计语言模型

统计语言模型是做什么的，首先他是个语言模型，就是对语言进行预测的模型

1.求P（“这个词的磁性”）和P（“这个词的词性”）哪个的概率更大

2.“这个词的——”

解决这个问题的办法就是统计办法。所以是统计语言模型

统计

1.

简而言之，就是有后面三个词的情况下，出现前面的词的概率。

如图所示，这个概率是每个词出现的概率的连乘，代表了这句话出现的概率。

2.对于第二个问题

对于下一个词的概率就可以表示为

P（“磁性”|“这个”，“词”，“的”）

P（“词性”|“这个”，“词”，“的”）等

前面这个词具体是谁，假设你有一个词典，这个概率的计算就是计算词典中每一个词在这三个词出现时出现的概率

n元语言模型

很明显，如果这句话的长度太长，计算量是非常庞大的。因此我们可以计算

P（“磁性”|“的”）

P（“词性”|“的”）等

一元的概率

P（“磁性”|“词”，“的”）

P（“词性”|“词”，“的”）等

二元以此类推，可以减少计算量

神经网络语言模型

独热编码

设置一个词典，每个词对应他的一个向量

“磁性”[0,0,0,1,0,0]

用这种方式让计算机认识单词，缺点是求不了每个词的相似度

接下来是神经网络语言模型，

如图所示，所做的操作是

w1，w2,w3，w4

w1*Q = c1

每个w都是如此操作，将c连起来组成C向量，用softmax函数激活就可以得到每个词的概率

Q是一个可以学习的参数，也就是说，只要我得到了Q就可以用w*Q得到任意一个词的词向量，求出两个词之间的概率

词向量

Q是神经网络语言模型的副产品，用w*Q得到的c就是词向量，w也算一种词向量。

但是通过Q得到的c可以用来求两个词的相似度，也可以求两句话的相似度，因此神经系统网络在解决第二个问题的同时，也能很好地解决第一个任务，也就是说第一个问题是下游问题

余弦相似度

余弦相似度就是用来评判两个向量的相似度，或者说夹角，夹角越小相似度越高

余弦相似度基于这样一个观点：两个向量的夹角越小，即它们越指向相同的方向，它们的相似度就越高。数学上，如果我们将两个向量A和B在多维空间中表示出来，那么这两个向量的夹角θ的余弦值可以通过下面的公式计算：

余弦相似度(𝐴,𝐵)=cos⁡(𝜃)=𝐴⋅𝐵\∥𝐴∥∥𝐵∥，就是他们的cos角的大小

学习视频连接如下

该文章是学习b站up主水论文的程序员的笔记，链接如下可自行学习

08 ELMo模型（双向LSTM模型解决词向量多义问题）_哔哩哔哩_bilibili

我.佛.糍.粑

关注

4
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

我.佛.糍.粑 CSDN认证博客专家 CSDN认证企业博客

码龄1年

28: 原创

104万+: 周排名

5万+: 总排名

1万+: 访问

: 等级

584: 积分

149: 粉丝

302: 获赞

8: 评论

184: 收藏

私信

关注

热门文章

最新评论

Pytorch实现Transformer
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
Pytorch 9
ha_lydms: 牛牛牛！太全面了，以后要用，忘记了直接来这里找表情包
吴恩达深度学习笔记.第二课第一周
CSDN-Ada助手: 恭喜您撰写了第13篇博客！阅读您关于吴恩达深度学习笔记的文章让我受益匪浅。建议在未来的创作中，可以逐步深入探讨吴恩达教授在深度学习领域的研究成果，并结合实际案例进行分析，让读者更加深入地了解相关知识。期待您在下一篇博客中的精彩内容！继续加油！
吴承恩深度学习第四周编程作业
CSDN-Ada助手: 恭喜用户第12篇博客的成功发布！看到你对吴承恩深度学习第四周编程作业的分享，让我感到非常兴奋。接下来，我建议你可以尝试扩展主题范围，探讨一些相关领域的知识，或者分享一些自己的学习心得和体会。希望你能够继续保持创作的热情，不断提升自己的写作水平和思考深度。加油！
吴承恩深度学习课程.第四周笔记
CSDN-Ada助手: 恭喜您完成了第11篇博客《吴承恩深度学习课程.第四周笔记》，持续创作不易，您的努力和坚持让人钦佩。希望您能继续保持学习的热情和耐心，多分享自己的学习心得和经验，或许可以结合实践案例或者个人见解，让读者更易于理解和接受。期待您的下一篇作品！愿您在学习和写作的路上不断进步，谦虚谨慎，保持初心。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。