Python程序设计字典

最新推荐文章于 2024-07-08 00:01:13 发布

Programming Scholar☉

最新推荐文章于 2024-07-08 00:01:13 发布

阅读量2.2k

点赞数 53

分类专栏： Python 头歌文章标签： python pycharm 编辑器开发语言

本文链接：https://blog.csdn.net/weixin_58063872/article/details/138047793

版权

Python 同时被 2 个专栏收录

48 篇文章 10 订阅

订阅专栏

头歌

27 篇文章 6 订阅

订阅专栏

本文介绍了如何使用Python处理文件，包括读取sfz.txt中的地区编码查询、建立字典并进行查找，统计唐诗.txt中作者作品数量，分析成绩.csv中的成绩数据，以及生成词云图片。展示了Python在文本处理、数据统计和可视化应用中的实践。

摘要由CSDN通过智能技术生成

教学案例十字典

1. 判断出生地

sfz.txt文件中存储了地区编码和地区名称

身份证的前6位为地区编码，可以在sfz.txt文件中查询到地区编号对应的地区名称

编写程序，输入身份证号，查询并显示对应的地区名称若该地区编码不在文件中，显示地区名称未知

文件操作

例

注意：字符串.strip(指定字符)方法，返回去除字符串尾部的指定字符后的字符串。若不指定字符，则去除尾部的空格和换行符。

字典的建立

若要建立以地区编码为键，地区名称为值的字典，可以打开文件，读取一行，将前六个字符（地区编号）作为键，第七个字符到最后（地区名称）作为值，建立字典。

对所有的行循环，就可以建立所有地区编号和名称的字典。

字典的查找

<字典>.get(<键>,<默认值>) 在字典中，若存在该键，则返回相应的值，否则返回默认值如果地区字典dqzd已经建立，通过get方法可以查找编码对应的地区名称，若无法找到，则返回未知

sfzh=input("请输入身份证号")
#代码开始
f1=open("step6//sfz.txt","r",encoding='GBK')
dq = {}
for i in f1.readlines():
    i = i.strip()
    dq[i[:6]]=i[6:]

print("地区名称",dq.get(sfzh[:6],"未知"))
#代码结束

2. 统计文档中作者作品数量

编写一个能计算文档《唐诗.txt》中各位作者作品数量的程序。遍历文档中每一行，提取作者的姓名，将其作为键加入到字典中，字典的值为作品数量。然后将字典转换为二维列表，按作品数量的降序排列。

字典的操作

字典是另一种可变容器模型，且可存储任意类型对象。字典的每个键值 key=>value 对用冒号 : 分割，每个键值对之间用逗号 , 分割，整个字典包括在花括号 {} 中 ,格式如下所示 d = {key1 : value1, key2 : value2 } 建立空字典 d={} 向字典添加新内容的方法是增加新的键/值对 d["范仲淹"]=1 则d为{"范仲淹":1} 修改键值对的方法为 d["范仲淹"]=2 则d为{"范仲淹":2} d["范仲淹"]的值为2

d.get(key,default)键存在则返回相应值，否则返回默认值

字典转换为二维列表

lt = list(d.items()) 可将字典转换为二维列表，二维列表的每项值为列表，列表的第一项为字典的键，第二项为字典的值

f1=open("sy9//唐诗.txt","r",encoding='GBK')
#代码开始
zd = {}
for i in f1.readlines():
    i = i.strip()
    if i[:3].isdigit()==True:
        n = i.split(":")[0][3:]
        zd[n]=zd.get(n,0)+1

lb = list(zd.items())
lb.sort(key=lambda x:x[1],reverse=True)
#代码结束
for i in lb:
    print("诗人{}作品{}".format(i[0],i[1]))
f1.close()

3. 计算成绩及排序

成绩.csv如下所示，记录了同学的语数外的成绩、综合测评和体育成绩

综合测评有ABCD四个等级，体育成绩有优秀良好及格不及格四个等级 ABCD折算为100、80、60、0。优秀良好及格不及格折算为100、80、60、0 现计算每个人的总分并从高到低的排序，显示姓名和总分。

f1=open("sy9//成绩.csv","r",encoding="utf8")
zh={"A":100,"B":80,"C":60,"D":0}
ty={"优秀":100,"良好":80,"及格":60,"不及格":0}
#代码开始
xx = []
for i in f1.readlines():
    i = i.strip().split(",")
    cj = int(i[1])+int(i[2])+int(i[3])+zh[i[4]]+ty[i[5]]
    xx.append([i[0],cj])

xx.sort(key=lambda x:x[1],reverse=True)
#代码结束
for mm in xx:
    print("姓名{}成绩{}".format(mm[0],mm[1]))
f1.close()

4. 统计语文成绩各等级人数

成绩.csv如下所示，记录了同学的语数外的成绩、综合测评和体育成绩

现要统计语文科目优秀（90分及以上）、良好（80分-90分）、及格（60分-80分）、不及格人数

f1=open("sy9//成绩.csv","r",encoding="utf8")
yw={"优秀":0,"良好":0,"及格":0,"不及格":0}
#代码开始
for i in f1.readlines():
    i = i.strip().split(",")
    n = int(i[1])
    if n >= 90:
        yw["优秀"] += 1
    elif n >= 80:
        yw["良好"] += 1
    elif n >= 60:
        yw["及格"] += 1
    else:
        yw["不及格"] += 1

#代码结束
print("语文")
for mm in yw:
    print("{}人数{}".format(mm,yw[mm]))
f1.close()

5. 统计语数外成绩各等级人数

成绩.csv如下所示，记录了同学的语数外的成绩、综合测评和体育成绩

现要统计语数外各科目成绩优秀（90分及以上）、良好（80分-90分）、及格（60分-80分）、不及格人数。

f1=open("sy9//成绩.csv","r",encoding="utf8")
djrs=[]
km="语文","数学","英语"
for i in range(3):
    djrs.append({"优秀":0,"良好":0,"及格":0,"不及格":0})
#代码开始

for i in f1.readlines():
    i = i.strip().split(",")
    for j in range(3):
        n = int(i[j+1])
        if n >= 90:
            djrs[j]["优秀"] += 1
        elif n >= 80:
            djrs[j]["良好"] += 1
        elif n >= 60:
            djrs[j]["及格"] += 1
        else:
            djrs[j]["不及格"] += 1

#代码结束
for i in  range(3):
    print(km[i])
    for mm in djrs[i]:
        print("{}人数{}".format(mm,djrs[i][mm]))
f1.close()

6. 统计文件词语的词频

编写一个能统计文档中词语词频小程序。

统计文件中词频最高的15个词语（除了词牌名和作者）注意：标题行的空格是全角空格"　"(可复制此空格) 由于有一个词牌名为东风第一枝，需要将文件中的词牌名删除。(否则会多一个东风)

jieba库分词

jieba是Python中一个重要的第三方中文分词函数库 Jieba库的分词原理是利用一个中文词库，将待分词的内容与分词词库进行比对，通过图结构和动态规划方法找到最大概率的词组。 jieba.lcut(s) 精确模式对字符串s分词,产生一个列表

import jieba
f1= open("sy9//唐诗.txt", "r",encoding="GBK")
#代码开始
lb = []
for i in f1.readlines():
    i = i.strip()
    if i[:3].isdigit()==True:
        i = i.split(":")[1]
        if i[3:5]=="二首":
            i = i[:3]
    n = jieba.lcut(i)
    for j in n:
        lb.append(j)

zd = {}
for i in lb:
    if len(i) == 1:
        continue
    else:
        zd[i]=zd.get(i,0)+1
        
zd["东风"]=zd.get("东风",0)-1
items=list(zd.items())
items.sort(key=lambda x:x[1],reverse=True)
#代码结束
for i in range(15):
    print("{} {}".format(items[i][0],items[i][1]))

7. 唐诗文件词云图片

根据唐诗文件生成一个词云图片文件，存放在sy9文件夹的pict文件夹下的sc1.png ，要求图片宽1000，高700背景颜色白色，最多300个词，注意：字体使用sy9文件夹下的simhei.ttf字体文件

生成词云图片

wordcloud库概述 wordcloud是python的一个三方库,称为词云也叫做文字云,是根据文本中的词频,对内容进行可视化的汇总.

wordcloud.WordCloud(参数）

font_path : string #字体路径，需要展现什么字体就把该字体路径+后缀名写上，

如：font_path = 'sy9//simhei.ttf’

width : int (default=400) #输出的画布宽度，默认为400像素

height : int (default=200) #输出的画布高度，默认为200像素

background_color : color value (default=”black”) #背景颜色，如background_color='white',背景颜色为白色

max_words : number (default=200) #要显示的词的最大个数

import jieba
import wordcloud
f1= open("sy9//唐诗.txt", "r",encoding="GBK")
#代码开始
txt = f1.read()
pc = set()
f1.seek(0,0)
for line in f1:
    if " " in line:
        cp=line[:line.find(" ")]
        pc.add(cp)
        xm=line[line.find(" ")+1:].split("\n")
        pc.add(xm[0])

for i in pc:
    txt = txt.replace(i,"")
zd = {}
words = jieba.lcut(txt)
for i in words:
    if len(i) > 1:
        zd[i] = zd.get(i,0)+1
print(zd)
f1.close()
w=wordcloud.WordCloud(font_path="sy9//simhei.ttf",background_color="white",max_words=300,width=1000,height=700)
w.generate_from_frequencies(zd)

#代码结束
w.to_file("sy9//pict//sc1.png")

8. 选择题

Programming Scholar☉

关注

53
点赞
踩
42

收藏

觉得还不错? 一键收藏
0
评论
Python程序设计字典

Python程序设计教学案例十字典、头歌实训平台、判断出生地、统计文档中作者作品数量、计算成绩及排序、统计语文成绩各等级人数、统计语数外成绩各等级人数、统计文件词语的词频、唐诗文件词云图片、选择题、输入身份证号，查询并显示对应的地区名称若该地区编码不在显示地区名称未知、字典的建立文件操作字典的查找提取作者的姓名，将其作为键加入到字典中，字典的值为作品数量。字典转换为二维列表、记录了同学的语数外的成绩综合测评和体育成绩编写一个能统计文档中词语词频小程序。jieba库分词根据唐诗文件生成一个词云图片文件
复制链接

扫一扫