练习6: 组合数据类型 (第6周)

最新推荐文章于 2024-08-08 16:43:27 发布

北工彭于晏

最新推荐文章于 2024-08-08 16:43:27 发布

阅读量1.7k

点赞数

分类专栏： Python学习文章标签： Python基础

本文链接：https://blog.csdn.net/qq_19303727/article/details/96878157

版权

Python学习专栏收录该内容

24 篇文章 1 订阅

订阅专栏

第一题实例9：基本统计值计算

描述

这是"实例"题，与课上讲解实例相同，请作答检验学习效果。‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬

获取以逗号分隔的多个数据输入（输入为一行），计算基本统计值（平均值、标准差、中位数）‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬

除中位数外，其他输出保留小数点后两位。‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬

请补充编程模板中代码完成

代码如下

# 请在...补充一行或多行代码
# CalStatisticsV1.py
def getNum(): # 获取用户不定长度的输入
t = input()
t = t.split(',')
t = list(t)
j = 0
for i in t:
t[j] = eval(i)
j+=1
return t

def mean(numbers): # 计算平均值
t = 0
k = len(numbers)
for i in numbers:
t+=i
return t/k

def dev(numbers, mean): # 计算标准差
sdev = 0.0
for num in numbers:
sdev = sdev + (num - mean) ** 2
return pow(sdev / (len(numbers) - 1), 0.5)

def median(numbers): # 计算中位数
l = len(numbers)
numbers.sort()
if(l%2==0):
return (numbers[l//2]+numbers[l//2-1])/2
else:
return numbers[l//2]

n = getNum() # 主体函数
m = mean(n)
print("平均值:{:.2f},标准差:{:.2f},中位数:{}".format(m,dev(n,m),median(n)))

第二题实例10：文本词频统计 -- Hamlet

‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬

描述

这是"实例"题，与课上讲解实例相同，请作答检验学习效果。‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬

文本词频统计：：一篇文章，出现了哪些词？哪些词出现的最多？
‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬

英文文本：hamlet‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬.txt，参考附件‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬

请统计hamlet.txt文件中出现的英文单词情况，统计并输出出现最多的10个单词，注意：‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬

(1) 单词不区分大小写，即单词的大小写或组合形式一样；‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬

(2) 请在文本中剔除如下特殊符号：!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬

(3) 输出10个单词，每个单词一行；‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬

(4) 输出单词为小写形式。

代码如下

def getText():
txt = open("hamlet.txt", "r").read()
txt = txt.lower()
for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~':
txt = txt.replace(ch, " ") #将文本中特殊字符替换为空格
return txt

hamletTxt = getText()
words = hamletTxt.split()
counts = {}
for word in words:
counts[word] = counts.get(word,0) + 1
items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True)
for i in range(10):
word, count = items[i]
# print ("{0:<10}{1:>5}".format(word, count)) 输出出现最多的10个单词和其出现次数
print (word) #输出出现最多的10个单词

第三题人名独特性统计

描述

编程模板中给出了一个字符串，其中包含了含有重复的人名，请去重后给出独特性人名的统计。‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬

输出模板中字符串共有多少个独特人名。

代码如下

s = '''双儿洪七公赵敏赵敏逍遥子鳌拜殷天正金轮法王乔峰杨过洪七公郭靖
杨逍鳌拜殷天正段誉杨逍慕容复阿紫慕容复郭芙乔峰令狐冲郭芙
金轮法王小龙女杨过慕容复梅超风李莫愁洪七公张无忌梅超风杨逍
鳌拜岳不群黄药师黄蓉段誉金轮法王忽必烈忽必烈张三丰乔峰乔峰
阿紫乔峰金轮法王袁冠南张无忌郭襄黄蓉李莫愁赵敏赵敏郭芙张三丰
乔峰赵敏梅超风双儿鳌拜陈家洛袁冠南郭芙郭芙杨逍赵敏金轮法王
忽必烈慕容复张三丰杨逍令狐冲黄药师袁冠南杨逍完颜洪烈殷天正
李莫愁阿紫逍遥子乔峰逍遥子完颜洪烈郭芙杨逍张无忌杨过慕容复
逍遥子虚竹双儿乔峰郭芙黄蓉李莫愁陈家洛杨过忽必烈鳌拜王语嫣
洪七公韦小宝阿朱梅超风段誉岳灵珊完颜洪烈乔峰段誉杨过杨过慕容复
黄蓉杨过阿紫杨逍张三丰张三丰赵敏张三丰杨逍黄蓉金轮法王郭襄
张三丰令狐冲郭芙韦小宝黄药师阿紫韦小宝金轮法王杨逍令狐冲阿紫
洪七公袁冠南双儿郭靖鳌拜谢逊阿紫郭襄梅超风张无忌段誉忽必烈
完颜洪烈双儿逍遥子谢逊完颜洪烈殷天正金轮法王张三丰双儿郭襄阿朱
郭襄双儿李莫愁郭襄忽必烈金轮法王张无忌鳌拜忽必烈郭襄令狐冲
谢逊梅超风殷天正段誉袁冠南张三丰王语嫣阿紫谢逊杨过郭靖黄蓉
双儿灭绝师太段誉张无忌陈家洛黄蓉鳌拜黄药师逍遥子忽必烈赵敏
逍遥子完颜洪烈金轮法王双儿鳌拜洪七公郭芙郭襄'''
s = s.split()
s = set(s)
print(len(s))

第四题字典翻转输出

描述

读入一个字典类型的字符串，反转其中键值对输出。‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬

即，读入字典key:value模式，输出value:key模式。

代码如下

s = input()
try:
d = eval(s)
e = {}
for k in d:
e[d[k]] = k
print(e)
except:
print("输入错误")

第五题《沉默的羔羊》之最多单词

描述

附件是《沉默的羔羊》中文版内容，请读入内容，分词后输出长度大于2且最多的单词。‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬

如果存在多个单词出现频率一致，请输出按照Unicode排序后最大的单词。

代码如下

import jieba
txt = open("沉默的羔羊.txt", "r",encoding="utf-8").read()
words = jieba.lcut(txt)
counts = {}
for word in words:
if len(word)==1 or len(word)==2:
continue
else:
counts[word] = counts.get(word,0)+1
items = list(counts.items())
items.sort(key = lambda x:x[1],reverse=True)
word,count = items[0]
print("{}".format(word))