#coding:utf-8
#用python读取文本并统计单词数量
#读取整个文件
with open('文本名称.txt') as file_object:#此处的文本文件与python文件放在同一目录下
contents = file_object.read()
print(contents.rstrip())#删除字符串末尾的空白并输出
#统计单词出现次数
a = contents.split()
num = len(a)
print(num)
运行结果:
升级版:
#用python读取文本并计算每个单词出现的次数
import re#使用正则表达式,导入re模块
#读取文件
with open('文本名称.txt','r') as file:#文本文件和python文件放在同一目录下
text=file.read()
text_word=re.sub(r'[/d,/w]','',text)#剔除特殊符号(注意斜杠方向)
text_new=text_word.lower()#将单词全部转换成小写
words=text_new.split()#将句子切分为单词
total=len(text_new)#统计单词总数
print(total)#显示单词总数
#用一个字典来计算每个单词出现的次数
word_count={}
for word in words:
if word in word_count:
word_count[word]+=1
else:
word_count[word]=1
print(word_count)#显示每个单词出现的次数
运行结果: