[学习日志]自然语言处理-斯坦福绪论

最新推荐文章于 2024-09-24 09:49:39 发布

烫烫烫烫的若愚

最新推荐文章于 2024-09-24 09:49:39 发布

阅读量95

点赞数

文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gjh1716718326/article/details/113653494

版权

关于语言

这里教授的解读很短，但是还是非常令人震撼的。虽然没什么知识含量，但是听完我就燃起来了。

1/N - One Hot编码

在这里插入图片描述
缺点：向量维度会很高，且向量不包含词间关系的信息

分布语义 - Distributional semantic

在这里插入图片描述
大体意思就是如果做完形填空能分出对错，你就算认识这个词了。
比如词嵌入

Word2Vector

似乎是个很牛逼的算法，把NPL推向了神经网络学习领域，内容如下
在这里插入图片描述
调整向量，使得中心词推出周围词的概率最大化。
但是问题是，只有一堆随机向量，要怎么计算概率呢？

所有词都要有两个身份，作为上下文词或作为中心词。每个身份对应一个向量u v
这里对于公式的解释很草率，上半部分是内积，内积表示两个向量的相似度，相似度越大出现概率就高

我的理解就是这个计算是人定的，当我们用内积，并做完极大似然之后，频繁组团词的内积自然就会高。和相似性没什么关系，重要的是给词一个关系，并不断强化这个关系

当然也有可能这个公式是从贝叶斯啥的推过来的？以后了解推导的时候可以留意一下

最后的损失函数
在这里插入图片描述

烫烫烫烫的若愚

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。