李宏毅机器学习16—Unsupervised learning：word embedding

最新推荐文章于 2024-02-24 20:00:43 发布

zeng-233

最新推荐文章于 2024-02-24 20:00:43 发布

阅读量254

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_57178683/article/details/116353442

版权

Unsupervised learning：word embedding

无监督学习：词嵌入

摘要：这节课通过介绍word embedding，说明什么是无监督学习以及word embedding的两种实现方法，简单介绍了一些运用word embedding方法的实际应用。，

目录

一、什么是word embedding

二、两种实现方法：

2.prediction based

三、如何训练这个神经网络

四、Prediction-based model的其他类型

五、Word embedding的一些应用成果

一、什么是word embedding

用向量表示word的方法：

1-of-N encoding

缺陷：没有办法区分单词之间的联系。

改进方法：可以增加词分类。

问题又来了，不同的词分类也存在一定的联系，这该如何改进？

Word embedding：把每个word向量都投影到一个多维度体系中。不同的维度具有不同的含义

Generating word vector是无监督的：向神经网络输入一个单词，输出为word embedding对应的向量。（只有输出，没有输出的样子）

原理：理解一个单词意思是通过上下文语境

二、两种实现方法：

1.count based

如果有两个单词wi和wj常常出现在同一篇文章，那么它们的vector可能是非常接近的

2.prediction based

训练的神经网络，输入是wi-1的1-of-n encoding向量ÿ

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
李宏毅机器学习16—Unsupervised learning：word embedding

Unsupervised learning：word embedding无监督学习：词嵌入摘要：这节课通过介绍word embedding，说明什么是无监督学习以及wordembedding的两种实现方法，简单介绍了一些运用wordembedding方法的实际应用。，目录一、什么是word embedding二、两种实现方法：1.count based2.prediction based三、如何训练这个神经网络四、Prediction-based model的其他类...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。