Unsupervised Learning: Word Embedding

最新推荐文章于 2022-09-15 00:05:30 发布

likyoo

最新推荐文章于 2022-09-15 00:05:30 发布

阅读量359

收藏

点赞数

分类专栏： Machine Learning 文章标签： machine learning Unsupervised Learning

转载或使用请注明出处( cvblog.top )

本文链接：https://blog.csdn.net/li_k_y/article/details/104088433

版权

Machine Learning 专栏收录该内容

37 篇文章 2 订阅

订阅专栏

Unsupervised Learning: Word Embedding

Word Embedding 是 Dimension Reduction 的一种应用。

要用一个vector来表示一个word，有什么方法呢：

1-of-N Encoding:

每一个词汇对应vector的一维，如：

这种方式没法体现出word之间的关系，无法表达出语义

Word Class:

这其实就是聚类的方法，在这里，我们认为Clustering无法表达出class和class之间的联系

Word Embedding：

Word Embedding就是把word映射到高维空间（这里虽然说是高维空间，但维度还是要比 1-of-N 的vector维度要小）

要怎么做Word Embedding呢？Word Embedding是一种无监督的方法，怎么让machine阅读大量文章之后自己得到他的Word Embedding呢？

我们可以认为通过上下文可以得到词汇的词义，怎么体现出context来呢？一般有两种方法：

1. Count based

即要使得 V(wi)和V(wj)的内积和 wi和wj在相同文章出现的次数越接近越好。

其实就是做LSA(latent semanticanalysis,潜在语义分析)，用SVD的方法解就可以了。

2. predition based

它的input是W(i-1)个词汇，输出是W(i)个词汇

我们把第一个hiden layer的Input：z1 z2 ......拿出来，Z就代表这个词汇。

将input扩展到多个词汇（仅仅两个词汇之间的联系是比较弱的）：

可以看到，他的input的word是共享参数的，原因：

1. 对于出现在不同位置i的词汇，输出要一样

2. 可以减少参数量

在做 gradient descent 的时候怎么让 W1=W2 呢？

Various Architectures:

from：https://www.youtube.com/watch?v=X7PH3NuYW0Q&list=PLJV_el3uVTsPy9oCRY30oBPNLCo89yu49&index=23

likyoo

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值