python统计文本文件的字数

s

转的,出处找不到了。

还有这个也不错:https://code.google.com/p/pyzh/


统计文本文件的字数,从当前目录下的file.txt取文件

# -*- coding: GBK -*-
import string
import sys
reload(sys)

def compareItems((w1,c1), (w2,c2)):
    if c1 > c2:
        return - 1
    elif c1 == c2:
        return cmp(w1, w2)
    else:
        return 1

def main():
    fname = "file.txt"
    
    try:
        text = open(fname,'r').read()
        text = string.lower(text)
    except:
        print "\nfile.txt is not exist!!! or There is a R/W error! "
        sys.exit()

    for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_`{|}~':
        text = string.replace(text, ch, ' ')
    words = string.split(text)

  
    counts = {}
    for w in words:
        counts[w] = counts.get(w,0) + 1
    
    n = input("\n输入要统计的top单词数:")
    items = counts.items()
    
    items.sort(compareItems)
    
    max = len(items)
    print "\n单词总计:" + str(len(words))
    print "单词净个数(已去重):" + str(max)
    print "\n"
    if n > max:
        n = max
    for i in range(n):
        print "%-10s%5d" % items[i]

if __name__ == '__main__': 
    main()





s


  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值