python哈姆雷特词频统计_Python实例10：文本词频统计

最新推荐文章于 2023-04-20 15:24:16 发布

weixin_39555320

最新推荐文章于 2023-04-20 15:24:16 发布

阅读量2.4k

点赞数 1

文章标签： python哈姆雷特词频统计

使用Python进行英文文本《哈姆雷特》和中文文本《三国演义》的词频统计。通过CalHamletV1.py计算《哈姆雷特》的前10高频词，通过CalThreeKingdomsV1.py和CalThreeKingdomsV2.py统计《三国演义》的前15高频词，排除部分常用词汇。

摘要由CSDN通过智能技术生成

Python实例10：文本词频统计

6.6.1 问题分析

在英文中文中，出现哪些词，出现多少次？

6.6.2 hamlet英文词频统计

CalHamletV1.py

6.6.3 三国演义人物出场统计

CalThreeKingdomsV1.py

CalThreeKingdomsV2.py

# CalHamletV1.py

def getText(): #获取文本，归一化处理文本

txt = open("E:\python\learn\hamlet.txt","r").read() #打开文件

txt = txt.lower() #将所有大写字母变成小写

for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_{|}~"': #将文本中特殊符号替换为空格

txt = txt.replace(ch," ")

return txt

hamletTxt = getText()

words = hamletTxt.split() #采用空格将字符串中的信息进行分隔，以列表形式返回给变量

counts = {}

for word in words:

counts[word] = counts.get(word,0) + 1 #统计字数

items = list(counts.items()) #将字典类型转换成列表类型

items.sort(key=lambda x:x[1], reverse=True) #对一个列表按照键值对的2个元素的第2个元素进行排序，排序方式为由大到小的倒排

for i in r

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39555320

关注关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python123词频统计之哈姆雷特_【Python】文本词频统计

weixin_39552179的博客

12-06

4563

哈姆雷特英文三国演义中文哈姆雷特英文词频分析def getText():txt=open("hamlet.txt","r").read()#打开文本,输入具体的文本路径txt=txt.lower()#将文本中所有的英文字符变成小写for ch in '!"#$%&()*+,-./;:<=>?@[\\]^‘_{|}~':txt=txt.replace(ch," ")return ...

python英文文本词频统计_python第五天：Hamlet英文词频统计

weixin_39670441的博客

11-25

472

1 #CalHamletV1.py2 def getText(): #定义函数读取文件3 txt = open("hamlet.txt","r").read()4 txt = txt.lower() #将所有字符转换为小写5 for ch in '!@#$%^&*(_)-+=[...

参与评论您还未登录，请先登录后发表或查看评论

第6周文本词频统计 -- Hamlet（附文本文件）

weixin_52120741的博客

07-02

7576

python学习文本词频统计hamlet三国演义

04-10

python学习文本词频统计hamlet.txt三国演义.txt

python 英语词频统计_Python小程序—文本词频统计

weixin_39571749的博客

11-23

444

第一部分英文文本分析词频以Hamlet文本为例，文本下载链接： https://python123.io/resources/pye/hamlet.txt#CalHamletV1.py#hamlet文本下载链接：https://python123.io/resources/pye/hamlet.txtdef getText(): #对文本归一化处理（变为小写，特殊字符替换为空格）txt ...

python哈姆雷特词频统计_人生苦短我用Python——哈姆雷特词频统计

weixin_39678451的博客

11-20

2295

在本文中利用Python对Hamlet英文词频进行统计，我们解决该问题的基本流程应该如下：1、读取文件2、将所有英文字母变成小写3、根据标点符号，对!'#$%&()*+,-./:;?@[\\]^_‘{|}~等对单词进行分割，形成列表4、对每个单词进行计数f1 = open("hamlet.txt",encoding="utf-8")f2 = f1.read()text = f2.lower()st...

Python实例10：文本词频统计

LuckSugar

08-06

6107

Python实例10：文本词频统计 6.6.1 问题分析在英文中文中，出现哪些词，出现多少次？ 6.6.2 hamlet英文词频统计 CalHamletV1.py 6.6.3 三国演义人物出场统计 CalThreeKingdomsV1.py CalThreeKingdomsV2.py # CalHamletV1.py def getText(): #获取文本，归一化处理文本 txt = open("E:\python\learn\hamlet.txt","r").read()

Python之词频统计

04-20

在这个场景中，我们有两个具体的实例：对《三国演义》人物出场的统计以及对莎士比亚作品《哈姆雷特》（HAMLET）的词频分析。首先，让我们从《三国演义》的人物出场统计开始。这可能涉及到读取文本文件，然后使用...

python中文词频排序_python统计词频并排序

weixin_42524703的博客

03-02

1118

Python 贝叶斯文本分类模型从原理到实现朴素贝叶斯分类器是一种有监督学习, 常见有两种模型, 多项式模型(multinomial model) 即为词频型和伯努利模型(Bernoulli model)......pyinstaller 库的实例请使用 pyinstaller 库将第 6 周课后练习中“哈姆雷特词频统计”程序打包成单独文件。(上述内容仅供个人学习使用,禁止转载) 第 5 页/共...

Python练习题15：文本词频统计：英文版哈姆雷特

qq_38958704的博客

11-07

5468

《Hamlet》和《三国演义》词频统计

Jackson的博客

01-31

3029

利用python实现对中英文文本的词频统计 英文文本《Hamlet》 code1： #CalHamlet.py def getText(): txt = open("hamlet.txt", "r").read() txt = txt.lower() for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~': ...

词频统计之《哈姆雷特》

weixin_45735242的博客

04-02

7694

Python课后作业 1. 文本词频统计 -- Hamlet - v2 ---- （第九次作业）

Love 6's Private Blog

05-07

1360

文章目录前引原题题目代码实现前引这道题浪费了我将近一个小时因为我习惯布置了作业就马上给他AC了之后就不管了老师布置的作业倒好一点格式没给题目中utf-8格式也没说全局编码也要重新设置一点非常非常简单的应用题嗯是变成了一道格式题目解析题原题题目代码实现 # coding=gbk f = open("hamlet.txt") content = f.read() d = {} num = int(input());count = 0 replacestr = '!"#$%

文件词频统计--Hamlet

风间琉璃的博客

11-03

4373

Python 《Hamlet》哈姆雷特英文词频统计