Python 浙江高考英语完型词频统计字典

最新推荐文章于 2023-12-26 13:53:58 发布

九歌问天

最新推荐文章于 2023-12-26 13:53:58 发布

阅读量654

点赞数 1

分类专栏： Python 文章标签： python

本文链接：https://blog.csdn.net/QYFH2021/article/details/123783275

版权

Python 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

前言

好久没更新了。这段时间忙完期末又开始忙期中了……

python小白，老师布置的作业是多练习列表，字典，元组和集合。

于是乎，我照着书用字典实现了中英文词频统计。下面这个代码是我自由发挥的浙江高考英语完型词频统计。不过，统计出来的词都好简单哦哈哈哈~

第一次用计算机来解决我实际生活中的小问题，开心，纪念下。

等我会做网页了把txt文件po上来，有空我也会迭代新版本，欢迎提出优化意见。

注意点

比较粗糙，无法排除很多简单的词，只能自己去筛选
打印的是前800个，词频最少是2次
文档里若中英文混合，则需把中文手动去除
txt文件要和py文件在同一个文件夹，且txt文件的命名注意：不要手动加txt的后缀，会报错

代码

#字典-带排除的浙江高考完型词频统计
#zjgkwx.py
excludes = {"b","c","d","from","the","and","of","you","a","i","my","in","an","me","we","our","they","us","their","you","your","he","his","her","she","it","its","this","that",
            "those","these","there","here","who","where","what","which","when","how","because","however","but","or","so","time","with","is","as","out","had","up","at","to","was","for","on","have","be","him"}
def getText():
    txt = open("zjgkwx.txt","r",encoding='utf-8').read()
    txt = txt.lower()
    for ch in '——0123456789!\'"#$%&()*+,-./:;<=>?@[\\]^_`{|}~':
        txt = txt.replace(ch, " ")      #将文本中特殊字符替换为空格
    return txt
zjgkTxt = getText()
words = zjgkTxt.split()
counts = {}
for word in words:
    counts[word] = counts.get(word,0) + 1
for word in excludes:
    del(counts[word])
items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True)
for i in range(800):
    word, count = items[i]
    print("{0:<800}{1:>5}".format(word, count))

拓展

强推Python入门书《Python语言程序设计基础第2版》，主要是有实例，边学边实践，非常有意思！

九歌问天

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Python 浙江高考英语完型词频统计字典

#include <stdio.h>#include <string.h>#define MAXLEN 1001void Output(int *p,int len);//输出整型数组元素 void Invert(char *a,int *b);//将a字符逆置转换到整数数组b中，确保下标0对应个位而不是最高位 char str1[MAXLEN],str2[MAXLEN],str[2*MAXLEN];//存放乘数字符串以及乘积对应的字符串int a[MAXLEN],b[.
复制链接

扫一扫