python 三元组找上下位相同的词

最新推荐文章于 2024-07-05 03:34:42 发布

tsf_1993

最新推荐文章于 2024-07-05 03:34:42 发布

阅读量1.2k

点赞数

分类专栏： python 学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/baidu_26550817/article/details/77262408

版权

学习同时被 2 个专栏收录

45 篇文章 0 订阅

订阅专栏

7 篇文章 0 订阅

订阅专栏

import jieba
import nltk
f=open("corpus.txt", 'r', encoding='utf-8',)
sents=[]
for line in f:
    sents.extend(jieba.cut(line.strip()))
finder=nltk.collocations.TrigramCollocationFinder .from_words(sents)
bigram_measures=nltk.collocations.BigramAssocMeasures()

resu=sorted(finder.ngram_fd.items(), key=lambda t: (-t[1], t[0]))[:100]
tuples = []
for x in resu:
    for y in resu:
        if x[0][0]==y[0][0] and x[0][2]==y[0][2] and x[0][1]!=y[0][1] :
            if [y[0][1],x[0][1]] in tuples:
                break
            tuples.append([x[0][1],y[0][1]])
            print(x[0][1]+"=="+y[0][1])
tuples

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

tsf_1993 CSDN认证博客专家 CSDN认证企业博客

码龄10年

53: 原创

19万+: 周排名

137万+: 总排名

15万+: 访问

: 等级

1910: 积分

14: 粉丝

16: 获赞

20: 评论

67: 收藏

私信

关注

热门文章

分类专栏

CRF 2篇
机器学习 8篇
学习 45篇
分类 2篇
nlp 2篇
nlp工具 6篇
翻译文章 1篇
java 2篇
python 7篇
spark 2篇
solr 2篇
tensorflow 2篇
elasticsearch 1篇
新年 1篇
AI 2篇
demo 1篇

最新评论

nested exception is java.lang.NoSuchMethodError: com.fasterxml.jackson.core.JsonGenerator.writeStart
mp437376671: 发的什么几把玩意
人民币金额大写转小写
被强煎的yu: 感谢楼主分享，正好用到这个功能
jupyterhub安装
~ ♚: 安装jupytherhub之后默认版本python3.6，变成了3.7，安装jupyterhub时他要求更新，不更新就安装不了
word2vec训练参数说明
消失的龙猫: 老哥，我加载模型后，使用most_similar方法给定a,b(存在某种关系)，然后输入c，通过这种关系来反推与c存在联系的数据d。但是求出的d与实际结论有很大不同，请问这种情况要怎么做呢，
从图片中提取人脸
三角室: https://www.jianshu.com/p/4fa11f36b8cc 将人物抠出来，可以更换背景！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。