[Python]任一个英文的纯文本文件，统计其中的单词出现的个数。(考虑单词-分行）

最新推荐文章于 2023-06-20 16:40:41 发布

danation

最新推荐文章于 2023-06-20 16:40:41 发布

阅读量9.2k

点赞数 1

分类专栏： python 文章标签： python 正则表达式

本文链接：https://blog.csdn.net/danation/article/details/76451319

版权

该博客介绍如何使用Python统计英文纯文本文件中的单词数量，包括处理单词因分行而用'-'连接的情况。通过正则表达式替换标点符号为空格，然后分割单词，特别处理了单词被'-'分隔的情况。

摘要由CSDN通过智能技术生成

第 0004 题：任一个英文的纯文本文件，统计其中的单词出现的个数。

思路：英文的纯文本文本，除了空格，句号，逗号，感叹号等等全都是单词的分割点，原本想着分开讨论，后来发现网上有人用了正则表达式的替换将所有其他的标点符号替换成空格，再统一分割，我借鉴了这种做法，借鉴代码代码有点问题，我在此基础上进行了修改，而且考虑到英语单词由于一行位置不够，用-连接进行分行的情况，用if语句进行考虑。

代码如下：

#coding=utf-8

import re
def get_word_frequencies(file_name):
    dic = {}
    txt = open(file_name, 'r').read().splitlines()

    n=0
    for line

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

danation

关注关注

1
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Python:统计文件中所有英文单词的数量

caoxinjian423的博客

01-06

1万+

#!/usr/bin/env python # coding:UTF-8 """ @version: python3.x @author:曹新健 @contact: 617349013@qq.com @software: PyCharm @file: 统计文件中所有英文单词的数量.py @time: 2019/1/1 20:12 """ import re words = {} r = r...

0004题--任一个英文的纯文本文件,统计其中的单词出现的个数.

Lesliezhangzss的博客

01-15

756

今天练习了一个简单的项目，后面有我自己在网上找的一段文章用作练习。 0004题–任一个英文的纯文本文件,统计其中的单词出现的个数. import sys x=input("请输入你查找的单词") txt1=open(r'D:\python练习内容\learning1.txt') txt2=txt1.read() txt_list=txt2.split(' ') a=0 i=0 for i in...

参与评论您还未登录，请先登录后发表或查看评论

python练习题，任一个英文的纯文本文件，统计其中的单词出现的个数

weixin_48089790的博客

03-23

1179

自我记录学习python的道路问题二：任一个英文的纯文本文件，统计其中的单词出现的个数。分析：以读取模式打开文件，并以文本模式处理它。使用Read()函数读取文本。使用空格分隔符分割文本，句子中的单词由一个空格字符分隔。分割列表的长度应该等于文本文件中的单词数。可以通过在分割前清理字符串或在分割后验证单词来细化计数 Code： file = open("English_1.txt", "rt") data = file.read() words = data.split() print(

第 0004 题：任一个英文的纯文本文件，统计其中的单词出现的个数

天道酬勤

11-23

2497

第 0004 题：任一个英文的纯文本文件，统计其中的单词出现的个数。 1、strip()没有参数时，删除空白符，包括\n \r \t 空格。strip() 函数只能用于str类型，list类型等不可用。 2、split()用于分割，分隔符可以自己制定 def word_counts(inputfile): """ """ if os.path.isfile(inputfile)

Python统计纯文本文件中英文单词出现个数的方法总结【测试可用】

09-20

在Python编程语言中，对于统计纯文本文件中英文单词出现的个数是一项基础但十分实用的操作。这项操作在数据分析、文本处理、以及各种文本相关项目中都十分常见。本文将通过实例详细分析并总结了在Python中统计文本...

Python实现统计单词出现的个数

09-22

通过以上介绍，我们可以看出使用Python来统计文本文件中单词出现的频率是一个既简单又高效的过程。这种技术不仅适用于简单的文本处理任务，还可以扩展应用到更复杂的自然语言处理项目中。希望本文能为你提供有用的...

Python读取英文文件并记录每个单词出现次数后降序输出示例

09-20

在Python编程中，读取英文文件并记录每个单词出现的次数是常见的文本处理任务，尤其在数据挖掘和自然语言处理领域。以下是一个具体的示例，它涵盖了如何完成这个任务，涉及到了文件操作、字符串处理、字典操作以及...

Python实现统计英文单词个数及字符串分割代码

09-22

以下是一个示例，展示了如何读取文件并统计其中的单词数量： ```python # 获取当前工作目录 info = os.getcwd() # 打开文件并读取内容 fin = open(u'c:/a.txt') info = fin.read() # 按照空格分割内容，得到单词...

任一个英文的纯文本文件，统计其中的单词出现的个数

minhoag的博客

07-02

1077

import re with open('a.txt', 'r') as f: total = f.readlines() # 读取文本文件的每一行代码 s = {} # 用于储存单词以及单词的个数 for line in total: # 对每一行进行单词识别 a = re.findall(r'[^A-Z\'a-z$]+', line) # 具体参考re模块的使用 for i in a: line = line.replace(i, ' ') # 将.

每天一个python小程序 004：任一个英文的纯文本文件，统计其中的单词出现的个数

我多么希望明天有太阳，来灼烧我腐烂的梦想

03-16

2247

#coding=utf-8 ''' 第 0004 题：任一个英文的纯文本文件，统计其中的单词出现的个数 ''' import re,os,sys path=os.path.split(os.path.realpath(__file__))[0]; File=open(path+"\\input.txt").read() data=re.split(r'\s+',File) Dict={}

如何用Python实现任一个英文的纯文本文件，统计其中的单词出现的个数？

最新发布

strangequark的博客

06-20

1134

读取txt文件，一篇英文文章，统计该文章中某个单词的出现次数。

任一个英文的纯文本文件，统计其中的每个单词出现的个数，注意是每个单词

qq_32696559的博客

04-21

817

示例 1：输入：s = “a0b1c2” 输出：“0a1b2c” 解释：“0a1b2c” 中任意两个相邻字符的类型都不同。 “a0b1c2”, “0a1b2c”, “0c2a1b” 也是满足题目要求的答案。示例 2：输入：s = “leetcode” 输出："" 解释：“leetcode” 中只有字母，所以无法满足重新格式化的条件。示例 3：输入：s = “1229857369” 输出：...

读取txt文档中单词，并计算单词出现的次数（英文文档）

阳光宅男

06-13

3960

2013/6/6去杭州博克软件onsite interview。哥之前做足了准备，几乎把自身的毕生所学全部温习了，以为万事俱备了。马的，下午14：00过去的时候，前台居然在发粽子，让我坐一下，等会儿HR会找人来面我。我在那里等了十来分钟。然后HR叫我过去，然后把我领到了一个小房间，给我端了杯水，叫我再坐一会，技术面试的人马上就来了。哥无聊在那里坐等看了会杂志，然后一个留了一小啜胡子的中年男子进

python计算单词出现次数_关于统计某一个单词在文本中出现的次数

weixin_39776787的博客

11-24

1147

人生苦短，我用Python.用了不会，来到segment.我是一个python 初学者，想要实现一个“模块”，可以让用户输入某个单词，然后就可以得到它在文本中出现的次数。试了一个下午，但由于自学，有些地方自己不是很懂，在google上，以及http://stackoverflow.com/ 上，没有找到适合自己的答案。（大多都是统计所有单词的次数，以及有些局部的函数自己不是很明白）所以，把自己想...

统计英文文档里每个单词出现的次数

a542558857的博客

04-09

658

最近想实现一个统计英文档单词出现次数的功能。查找规则是将文档里连续出现的<字母>判断为一个单词,如:“D) Let's go to d”，会将其判断为D、Let、s、go、to五个单词并统计出现的次数并不区分大小； //这个类用来存放出现的单词和其出现的次数 public class WordNode { 　　public string word; 　　pu...

文本文件单词统计

三舍的博客

06-01

2554

【问题描述】假设有如下的英文文本文档：（文件名是：History.txt） History Taiyuan University of Technology (TYUT) can trace its origin to the Western Learning School, ShanxiGrand Academy, established in 1902 as one of the earliest three universities in China’s higher educationhistor

统计一个文本文件中单词的个数

05-25

可以通过Python来实现统计一个文本文件中单词的个数，具体步骤如下： 1. 打开文本文件并读取内容 2. 将文本内容按照空格分割成单词列表 3. 统计单词列表中不同单词的个数 4. 输出单词个数下面是一个Python实现的...