word2vec浅析

最新推荐文章于 2021-09-19 21:08:38 发布

O白马非马O

最新推荐文章于 2021-09-19 21:08:38 发布

阅读量1.2k

点赞数

文章标签：谷歌自然语言处理 NLP python 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dahunbi/article/details/73129733

版权

word2vec是谷歌2013年发布的开源工具，用于词向量化。通过 Continuous Bag of Words (CBOW) 和 Skip-gram 模型捕捉语境信息并压缩数据。在情感分析中，word2vec能考虑上下文关系，提高分析效果。通常步骤包括：获取大量文本，分词，使用word2vec训练词向量。大而权威的文本源能生成更合理的词向量。

摘要由CSDN通过智能技术生成

word2vec是google在2013年公布的开源工具包，可以用来将word vector化。原理如下

word2vec中的数学原理详解（一）目录和前言

简单来说：

为了实现文章或者一段话的情感分析，有以下几种方法：

1. 简单分为正向情感和负向情感，比如 good 就+1， bad就-1

2. 利用bags of words , 认为词是独立的，缺点是不考虑上下文的联系

3. 利用word2vec，考虑上下文

该方法可以在捕捉语境信息的同时压缩数据规模。Word2Vec实际上是两种不同的方法：Continuous Bag of Words (CBOW) 和Skip-gram。CBOW的目标是根据上下文来预测当前词语的概率。Skip-gram刚好相反：根据当前词语来预测上下文的概率。这两种方法都利用人工神经网络作为它们的分类算法。起初，每个单词都是一个随机 N 维向量。经过训练之后，该算法利用 CBOW 或者 Skip-gram 的方法获得了每个单词的最优向量。

参考

源文档<

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
word2vec浅析

word2vec是google在2013年公布的开源工具包，可以用来将word vector化。原理如下word2vec中的数学原理详解（一）目录和前言简单来说：为了实现文章或者一段话的情感分析，有以下几种方法：1. 简单分为正向情感和负向情感，比如 good 就+1， bad就-1 2. 利用bags of words , 认为词是独立的，缺点是不考虑上下
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。