Python入门基础超详细的Hamlet词频统计

本文介绍了如何使用Python进行Hamlet文本的词频统计。首先,通过链接获取hamlet.txt文件,然后在自定义函数中读取文件并替换特殊字符。接着,以空格分隔单词,利用字典的get()函数统计每个单词出现的次数。尽管代码简单,但对于Python初学者来说是一个很好的实践示例。
摘要由CSDN通过智能技术生成

程序分析

        1.我们准备一个hamlet.txt文件放入到我们的项目中,内容在下方链接:            https://python123.io/resources/pye/hamlet.txt

        2.在自定义函数中以只读方式打开,并使用字符替换函数replace()将特殊字符替换成空格。


        3.将数据已空格为标志进行切割成列表形式,遍历列表将单词计数存入字典中。这里我们要使用字典中的get()函数,计数时分两种情况:(1)如果当前单词不在字典中则get()函数返回0并加1赋值形成新的键值对。(2)如果当前单词已存在字典中(已存在有键值对)get()函数返回键中的值再加1重新赋值计数。

源码

def getText():
    file = open("hamlet.txt", "r").read()
    # 以只读的方式打开文件
    file = file.lower()
    # 将文件中的字母全部变为小写
    for flag in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~':
        # 将文章中的特殊字符替换成空格并返回
        file = file.replace(flag, " ")
    return file


fileStr = getText()
words 
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值