用Python来count文档中的词个数

参考 : http://www.cnblogs.com/chhyong88/archive/2012/01/10/2317972.html
wr='i lo loe love you you you i'
def countt(wr):
    wd={}
    wn=wr.split()
    for i in range(0,len(wn)):
        if wn[i] !='':
                wn[i]=wn[i].strip()
                wn[i]=wn[i].lower()
                if wn[i] in wd:
                        wd[wn[i]]+=1
                else:
                        wd[wn[i]]=1

    wl=[(k,v) for k,v in wd.items()]
    print sorted(wl) #按key排序
    print sorted(wl, key=lambda x:x[1]) #按value排序,x:x[0]按key排序
countt(wr)
#[('i', 2), ('lo', 1), ('loe', 1), ('love', 1), ('you', 3)]
#[('lo', 1), ('love', 1), ('loe', 1), ('i', 2), ('you', 3)]

sorted排序:http://hi.baidu.com/leoomo/item/453201efe71427d3ea34c935

暂时写这些。下一步:

1. 实现中文的count

2. 从外部导入文档

3. 用linux服务器来编译

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值