python去除重复单词_Python重复的单词

我可以看到你在哪里排序,因为你可以可靠地知道你什么时候打了一个新单词并跟踪每个独特单词的计数。但是,您真正想要做的是使用哈希(字典)来跟踪计数,因为字典键是唯一的。例如:

words = sentence.split()

counts = {}

for word in words:

if word not in counts:

counts[word] = 0

counts[word] += 1现在,它将为您提供一个字典,其中键是单词,值是它出现的次数。您可以使用collections.defaultdict(int)执行某些操作,因此您只需添加以下值即可:

counts = collections.defaultdict(int)

for word in words:

counts[word] += 1但是甚至还有更好的东西...... collections.Counter会将你的单词列表转换成包含计数的字典(字典的扩展名)。

counts = collections.Counter(words)从那里你需要按排序顺序的单词列表及其计数,以便您可以打印它们。 items()将为您提供元组列表,sorted将按每个元组的第一项(在本例中为单词)排序(默认情况下)...这正是您想要的。

import collections

sentence = """As far as the laws of mathematics refer to reality they are not certain as far as they are certain they do not refer to reality"""<

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值