去除字符串数组中的重复词汇

最新推荐文章于 2024-05-27 13:31:34 发布

小游园

最新推荐文章于 2024-05-27 13:31:34 发布

阅读量1.1k

点赞数 3

分类专栏： Python在石油工程中应用智能钻完井油田大数据

本文链接：https://blog.csdn.net/s0302017/article/details/103332392

版权

在做文本分析的时候，经常需要把给定的词组中的重复词汇去掉，本文总结了四种去除重复词汇的方法。

第一种方法使用了reduce和lambda，第二种方法使用了set，第三种和第四章方法均使用了not in，具体代码如下：

from functools import reduce

wordsList = [
             ['周一'],
             ['周二', '周二', '周一', '周一'],
             ['周三', '周三', '周三', '周二', '周二'],
             ['周四', '周四', '周四', '周四', '周三', '周三'],
             ['周三', '周五', '周五', '周四']
            ]
#method one
#使用： reduce  lambda
#最后得到的词组可能乱序
wordsNoSame = list(reduce(lambda x, y: set(x) | set(y), wordsList))
print( 'method oen:\n', wordsNoSame )

#method two
#先把词组转换为一维数组，再转换成list，然后使用set去除重复词
#最后得到的词组可能乱序
words = []
for i in range( len(wordsList) ):
    words = words &#

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小游园

关注关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
去除字符串数组中的重复词汇

在做文本分析的时候，经常需要把给定的词组中的重复词汇去掉，本文总结了四种去除重复词汇的方法。第一种方法使用了reduce和lambda，第二种方法使用了set，第三种和第四章方法均使用了not in，具体代码如下：from functools import reducewordsList = [ ['周一'], ['周二', '周二...
复制链接

扫一扫