Day 01 词频统计

小说《Walden》单词词频统计
 
lambda表达式的形式: y=lambda x:x+1     其中x相当于输入的接口,x+1相当于返回值;
eg: g=lambda x: x**2
g(2)=4
 
 1 import re #正则表达式操作  此处用到re.split
 2 f=open('E:/Python培训/python_01/Walden.txt','r')
 3 #txt=f.read()    #将文本内容读到txt中
 4 '''txt=f.readline()
 5 f.close()'''
 6 txt=f.read()
 7 txt=txt.lower()
 8 txt1=re.sub('[().,?*\']','',txt)  #substitute 替换的意思 讲这些符号都换成''什么都没有
 9 words=txt1.split()  #字符分割
10 words_index=set(words)    #集合set 元素不重复
11 dic={word:words.count(word) for word in words_index}
12 res=sorted(dic.items(),key=lambda x:x[1],reverse=True)
13 print(res)

 

转载于:https://www.cnblogs.com/monologuesmw/p/9458740.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值