python文本关联分析_如何对文本内的某个词的关联词进行提取？

最新推荐文章于 2024-06-06 14:46:26 发布

weixin_39847722

最新推荐文章于 2024-06-06 14:46:26 发布

阅读量2.4k

点赞数

文章标签： python文本关联分析

简单提供几个思路。

比较常见的做法是通过训练词向量，计算词向量的相似度。正如题主所说的word2vec就是最常见的是训练词向量的方法。

word2vec是Google的一个开源工具，通过将词转化成向量的形式，可以把对文本內容的处理简化为向量空间中的向量运算，往往会结合余弦相似度来计算向量空间上的相似度，來表示文本语意上的相似度。

例如：

word2vec训练词向量的方法是通过上下文去预测某个词或者通过一个词去预测上下文，所以除了得到语义相近的词，往往还会得到搭配比较多的关联词。所以word2vec是可行的。同理，其他训练词向量的方法也是可以的，比如glove或者fasttext等。而对于计算相似度的方法就更多了，就不概述了。

还有通过句子结构分析和词与词之间的事理关系也是可以得到一些关联词，比如存在“不仅A而且B”这种句式时，A和B是很有可能是关联词，甚至是近义词。除了并列，还有顺承，转折等关系也是可以寻找关联词的。

只从词本身看，有时候研究词与词的共现关系或者根据相同上下文相邻词的频数也可以挖掘关联词。

weixin_39847722

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
python文本关联分析_如何对文本内的某个词的关联词进行提取？

简单提供几个思路。比较常见的做法是通过训练词向量，计算词向量的相似度。正如题主所说的word2vec就是最常见的是训练词向量的方法。word2vec是Google的一个开源工具，通过将词转化成向量的形式，可以把对文本內容的处理简化为向量空间中的向量运算，往往会结合余弦相似度来计算向量空间上的相似度，來表示文本语意上的相似度。例如：word2vec训练词向量的方法是通过上下文去预测某个词或者通过一个...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。