python统计英语单词出现次数

最新推荐文章于 2023-09-19 14:40:02 发布

君心似砂

最新推荐文章于 2023-09-19 14:40:02 发布

阅读量1.3k

点赞数 2

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/weixin_43116971/article/details/124274492

版权

python 专栏收录该内容

24 篇文章 6 订阅

订阅专栏

可以打包送给身边的英语老师了！

import codecs
import re
import os
import csv
#读入txt格式
print("请输入文件地址：中间使用/，例如：[C:/Users/Dell/Desktop/w.txt]")

file = input()
#文件名和地址分开
filepath,filename = os.path.split(file)
with open(file, 'r') as fd:
    data = fd.read()
    # 替换函数:用空格替换掉所有非字母
    fnosign = re.sub(r"[^A-Za-z]", " ", data)
    #拆分成列表
    flist = fnosign.split(" ")
    # list格式去除多余的空项
    while '' in flist:
        flist.remove('')

    #生成字典
    fnode = []
    for i in flist:
        if i not in fnode:
            fnode.append(i)
    #生成带有频数的字典
    f_node = {}
    f_node.fromkeys(fnode)
    for j in fnode:
        f_node[j] = flist.count(j)

name = "Frequency.csv"
file2 = os.path.join(filepath,name)  #路径拼接

#将数据写入csv文件
with codecs.open(file2, "w", "gbk") as f:
    csv_writer = csv.writer(f)
    csv_writer.writerow(["word", "times"])
    for name, times in f_node.items():
        csv_writer.writerow([name,str(times)])

python打包

我用的是anaconda，

安装pipenv，