小说瓦尔登湖单词词频统计

本文介绍了如何使用Python进行文本处理,包括下载《瓦尔登湖》的txt文件,去除标点符号,转换为小写,进行词频统计,并通过字典和lambda表达式排序。虽然遇到一些小错误,但通过Python提示解决了问题,熟悉了数据结构和方法。
摘要由CSDN通过智能技术生成

1.首先先去网上下载瓦尔登湖的txt文件(注意保存的路径,我女友姓裘便创建了个文件夹Qiu便于记忆 嘿嘿!)
在这里插入图片描述
2.打开jupyter notebook创建py文件
编写第一个代码:输入文章打开路径(我最后改了文件名请注意)
在这里插入图片描述
3.去掉文字首位的标点符号,并把首字母大写转成小写。代码如下
在这里插入图片描述
4.将列表用set函数转换成集合
在这里插入图片描述
5.创建一单词为‘key’,频率为值的字典
在这里插入图片描述
6.打印整理后的参数,其中利用lambda表达式,以字典中的值为排序的参数

评论 15
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值