十、词向量基础

最新推荐文章于 2024-08-21 11:18:36 发布

智享AI

最新推荐文章于 2024-08-21 11:18:36 发布

阅读量346

点赞数

分类专栏：深度学习文章标签：自然语言处理机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/guangzhanblog/article/details/120260608

版权

深度学习专栏收录该内容

34 篇文章 7 订阅

订阅专栏

1.计算机中如何表示一个词语

和frog最接近的前7个单词有哪些

1.1 向量空间分布的相似性

计算机中表示的词语需要满足向量空间分布的相似性，向量空间模型（VSM：Vector space model）是最常用的相似度计算模型，在自然语言处理中有着广泛的应用.
在这里插入图片描述

1.3 向量空间分布子结构

计算机中表示的词语同样需要满足向量空间子结构，学习的词向量模型最终目标是将词向量作为机器学习，特别是深度学习的输入和表示空间。
在这里插入图片描述

2. 词向量的概念及问题

2.1 词向量的概念

在自然语言处理的任务中，词向量（word2vec）是表示自然语言中单词的一种方法，即把每个词都表示为一个N维空间内的点，即一个高维空间内的向量。通过这种方法，实现把自然语言转换为向量计算。
词向量表示时会有哪些问题？词的关系如何表示？
- 不能分辨细节的差别
- 需要大量的人为劳动
- 主观
- 无法发现新词
- 难以精确计算词之间的相似度
实现词向量的两大挑战

3 词向量的使用

3.1 词向量的查询

自然语言是离散信号，比如“我”、“爱”、“人工智能。通常情况下，可以维护一个词向量查询表，实现单词转换为向量的目的，这个查询过程称之为Embeding Lookup。

3.2 词向量的张量计算

通过One-hot编码存储词向量的索引，并通过Embedding Matrix和GPU的张量计算获得单词的词向量表示：

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。