Python快速实现词频计算

from collections import Counter
from itertools import chain
def count_key_value(corpus):
    # word_freq 是个字典,key=词,value=词频
    # Counter 是实现的 dict 的一个子类,可以用来方便地计数,统计词频
    # chain函数来自于itertools库,itertools库提供了非常有用的基于迭代对象的函数,而chain函数则是可以串联多个迭代对象来形成一个更大的迭代对象
        # *的作用:返回单个迭代器
    word_freq = Counter(chain(*corpus))
    return word_freq

if __name__ == "__main__":
    corpus = [["今天", "是个", "好日子"],["今天", "是个", "坏日子"]]
    for item in chain(*corpus):
        print(item, end='  ')
    print("/n")
    print(count_key_value(corpus))

>>>今天  是个  好日子  今天  是个  坏日子  /n
>>>Counter({'今天': 2, '是个': 2, '好日子': 1, '坏日子': 1})
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值