多个txt内容合并并统计字频

当有很多txt,需要合并内容后,统计字频

1、合并txt

find ./ -name '*.txt' -exec cat {} \; >all_2.txt;

2、统计字频

import collections
with open('/data/crnn/wangxiang/all.txt','r',encoding='utf-8') as f:
    result=f.readlines()
    # print(result)
    all=''
    for i in result:  #获取所有内容,拼接成大字符串
        all=all+i   

    mycount = collections.Counter(all)
    # for key, val in mycount.most_common(10):  # 有序(返回前10个)
    for key, val in mycount.most_common(100000):  # 有序(返回前10000个)
        print(key, val)


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值