python词频统计之《哈姆雷特》_实现对Hamlet的文本词频统计

最新推荐文章于 2023-11-11 18:49:24 发布

weixin_39822184

最新推荐文章于 2023-11-11 18:49:24 发布

阅读量3.3k

点赞数

文章标签： python词频统计之《哈姆雷特》

代码如下：

#CalHamletV1.py

def getText():

txt=open("hamlet.txt","r").read()

txt=txt.lower()

for ch in '!"#%&()*+,-./:;<=>?@[\\]^_{|}·~''':

txt=txt.replace(ch,"")

return txt

hamletTxt=getText()

words=hamletTxt.split()

counts={}

for word in words:

counts[word]=counts.get(word,0)+1

items=list(counts.items())

items.sort(key=lambda x:x[1],reverse=True)

for i in range(10):

word,count=items[i]

print("{0:<10}{1:>5}".format(word,count))

首先是读取文本并且对文本进行归一化处理，然后利用字典组合数据格式对出现的次数进行统计然后输出。

运行后得到的统计数据如下：

the 1137

and 963

to 736

of 669

you 546

i 540

a 527

my 513

hamlet 459

in 435

可看出python非常简单的就能实现了对文本词频的统计。

另外需要注意的是，在文本读入过程前，需要将命名为hamlet的txt格式文本放在源代码的同一文件目录下。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39822184

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python学习文本词频统计hamlet三国演义

04-10

首先，我们可以使用`collections.Counter`来统计词频。打开"hamlet.txt"和"三国演义.txt"，逐行读取文本，然后对每行进行分词。Python的`str.split()`方法可以将字符串分割成单词列表。例如： ```python from ...

python词频统计之《哈姆雷特》_哈姆雷特词频统计,Hamlet

weixin_34234442的博客

02-21

7030

def getText():txt=open(“hamlet.txt”,“r”).read()txt=txt.lower() #将所有字母转换成小写for ch in ‘|"#$%&()*+,-./:;<=>?@[\]^{|}~’:txt=txt.replace(ch," “) #完成对txt的遍历，用空格代替特殊符号return txthamletTxt=getText()...

参与评论您还未登录，请先登录后发表或查看评论

Python英文词频统计（哈姆雷特）程序示例

永远是少年

12-13

9989

Python 《Hamlet》哈姆雷特英文词频统计

热门推荐

烟敛寒林的博客

04-18

2万+

英文词频统计 关键问题： 1、词语 -- 键 2、相同词语的累加 -- 值讨论：定义什么数据类型 -- 字典类型问题描述： I：文件的输入 P：采用字典类型的结构统计词语出现的频率 O：每个单词及单词出现的次数（要求输出前10个） IPO细化：第一步： (1) txt文件读取 -- txt.read("filename","r") (2) 文件大小写的转换 (3) 特殊字符(各种标点符号...

8-2 词频统计之《哈姆雷特》

c3872931的博客

07-18

1312

python123词频统计之哈姆雷特_【Python】文本词频统计

weixin_39552179的博客

12-06

4563

哈姆雷特英文三国演义中文哈姆雷特英文词频分析def getText():txt=open("hamlet.txt","r").read()#打开文本,输入具体的文本路径txt=txt.lower()#将文本中所有的英文字符变成小写for ch in '!"#$%&()*+,-./;:<=>?@[\\]^‘_{|}~':txt=txt.replace(ch," ")return ...

Python之词频统计

04-20

在这个场景中，我们有两个具体的实例：对《三国演义》人物出场的统计以及对莎士比亚作品《哈姆雷特》（HAMLET）的词频分析。首先，让我们从《三国演义》的人物出场统计开始。这可能涉及到读取文本文件，然后使用...

Python 合并多个TXT文件并统计词频的实现

09-18

在Python编程中，合并多个TXT文件并统计词频是一项常见的文本处理任务，尤其在数据分析、自然语言处理（NLP）等领域。本篇文章将详细介绍如何利用Python实现这一功能，并提供两个不同的实现方法。首先，让我们来看...

Python 分词，词频统计，寻找公共词

12-12

### Python 分词、词频统计及寻找公共词 #### 一、引言在文本分析领域，分词、词频统计以及寻找公共词是常见且重要的任务。通过这些技术，可以更好地理解文本内容，提取关键词，进而应用于搜索引擎优化、情感分析...

使用python的jieba库实现词频统计.zip

08-06

本项目利用jieba库实现了对两部文学作品——莎士比亚的《哈姆雷特》和罗贯中的《三国演义》——的词频统计和主要人物出场频率分析。首先，`threekingdoms.py`和`Hamlet.py`是两个Python脚本，分别用于处理《三国...

python哈姆雷特词频统计_Python实例10：文本词频统计

weixin_39555320的博客

11-20

2465

Python实例10：文本词频统计6.6.1 问题分析在英文中文中，出现哪些词，出现多少次？6.6.2 hamlet英文词频统计CalHamletV1.py6.6.3 三国演义人物出场统计CalThreeKingdomsV1.pyCalThreeKingdomsV2.py# CalHamletV1.pydef getText(): #获取文本，归一化处理文本txt = open("E:\p...

python哈姆雷特词频统计_人生苦短我用Python——哈姆雷特词频统计

weixin_39678451的博客

11-20

2295

在本文中利用Python对Hamlet英文词频进行统计，我们解决该问题的基本流程应该如下：1、读取文件2、将所有英文字母变成小写3、根据标点符号，对!'#$%&()*+,-./:;?@[\\]^_‘{|}~等对单词进行分割，形成列表4、对每个单词进行计数f1 = open("hamlet.txt",encoding="utf-8")f2 = f1.read()text = f2.lower()st...

python哈姆雷特词频统计代码_Hamlet（英文）词频统计

weixin_39600885的博客

12-06

3530

def getText(): #定义一个函数txt=open("hamlet.txt","r").read() # 打开一个文件txt=txt.lower() #将文本所有字符转为小写for ch in '|"#@!$%^*()\/?~`,.;:[]{}_-=+<>':txt=txt.replace(ch," ") #将所有的特殊符号替换为空格return txt #最终...

“Hamlet英文词频统计“实例讲解

W_chuanqi的博客

04-11

4241

一、问题分析需求：一篇文章，出现了哪些词？哪些词出现得最多？我们该怎么做呢？ 1.获取归一化文本我们在对一个文章进行统计之前，要确保它的 #CalHamletV1.py def getText(): txt = open("hamlet.txt", "r").read() txt = txt.lower() for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~': txt = txt.repla

Python入门基础超详细的Hamlet词频统计

qq_56656022的博客

02-16

6775

程序分析 1.我们准备一个hamlet.txt文件放入到我们的项目中，内容在下方链接： https://python123.io/resources/pye/hamlet.txt 2.在自定义函数中以只读方式打开，并使用字符替换函数replace()将特殊字符替换成空格。 3.将数据已空格为标志进行切割成列表形式，遍历列表将单词计数存入字典中。这里我们要使用字典中的get()函数，计数时分两种情况：(1)如果当前单词不在字典中则g...

Hamlet词频统计实例

qq_38290604的博客

02-09

3708

统计Hamlet中词频最高的十个词语，文章在https://python123.io/resources/pye/hamlet.txt 思路获取Hamlet文章，对文章进行处理，将所有大写字母转换成小写，将所有特殊符号转换成空格将所有单词以及出现的次数加到字典，转换成列表并进行排序将排序后前十个输出，即为词频最高的词汇将文章保存为TXT格式，并保存在代码所存的文件夹中代码 ...

Python——实现英文词频统计：以hamlet为例

An_xiaotaiyang的博客

06-23

3177

中国大学MOOC 嵩天老师在课堂上讲解的，附上代码和详细注释。代码和文本文件需要放到同一目录下。 def getText(): txt = open("hamlet.txt","r").read() txt = txt.lower() # 将所有字符转换为小写 for ch in '!@#$%^&*()":;?,.><+=-_{}[\\]\/|`~': #将所有特殊符号用空格替代 txt = txt.replace(ch," ") .

Python文本词频统计 -- Hamlet