实验9 文本分析

一系列Python编程任务,涉及文本分析的各个环节,从统计Hamlet和三国演义的词频,到排除无意义词汇,再到统计十九大专有名词,最后生成词云图,展现了Python在文本处理中的应用。
摘要由CSDN通过智能技术生成

第1关:Hamlet文本词频统计1

任务描述
本关任务:编写一个能统计Hamlet文本词频的小程序。

编程要求
根据提示,在右侧编辑器补充代码。
英文文本词频统计处理步骤:

打开hamlet.txt文件,并读取全部内容
将所有单词转为小写
将一些特殊字符’!"#$%&()*+,-./:;<=>?@[\]^_‘{|}~'替换为空格
用字符串分割方法split()将文本用空格分割,生成一个列表. split()方法默认参数为所有的空字符,包括空格、换行(\n)、制表符(\t)等。
对列表进行词频统计,保存在一个字典中
将字典转换为列表进行排序:按照词频排降序
输出列表前10项
测试说明
平台会对你编写的代码进行测试:

To be, or not to be: that is the question:
Whether 'tis nobler in the mind to suffer
The slings and arrows of outrageous fortune,
Or to take arms against a sea of troubles,
And by opposing end them.

生存或毁灭, 这是个必答之问题:
是否应默默

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Ssaty.

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值