python上机实验报告读取文件_Python程序设计实验八:文件

安徽工程大学

Python程序设计实验报告

班级:物流192 姓名:李心悦 学号:3190505218成绩:

日期:2020.6.3 指导教师:修宇

【实验名称】实验八 文件

【实验目的】

掌握读写文本文件或 CSV 文件,进而对数据进行处理的方法。

【实验条件】

PC机或者远程编程环境

【实验内容】

完成两个编程题。

1)水浒传词频统计

水浒传-词频统计

描述

使用词频统计的方法,生成《水浒传》出场次数最多的10个人物的姓名。

读取《水浒传》文本文件的代码如下:‬

txt = open("AllManAreBrothers.txt", "r", encoding="utf-8").read()

1957078-20200602164203365-684563321.png

代码模板:

# ThreeKingdomsV2

import jieba

# 读取txt文件,获取需要统计词汇的文本

txt = open("AllManAreBrothers.txt", "r", encoding="utf-8").read()

# 设置需要输出最多的前n位人物的数量

n = 10

# 请在下列exludes集合中,自行补充其他需要排除的词汇

excludes = { "两个", "一个", "只见", "如何", "那里", "哥哥", }

words = jieba.lcut(txt)

counts = {}

# 请扩展下列分支结构,转换更多替代词

for word in words:

if len(word) == 1:

continue

elif word == "宋江道":

rword = "宋江"

else:

rword = word

counts[rword] = counts.get(rword, 0) + 1

# 实现删除干扰词汇功能(此处约2行代码)

# 使用列表和lambda功能实现 词汇的排序 (此处约2行代码)

# 依次输出统计次数最多的前n位(此处约3行代码)

2)血压心率分析

描述

BP.txt”是以逗号分隔的日期、血压、心率记录数据文本文件( open('BP.txt',encoding="gbk"))

1957078-20200602164254277-1111612813.png

统计收缩压、舒张压、心率的总平均值(保留3位小数)。

1957078-20200602164336039-213423347.png

【实验过程】

1)水浒传词频统计

1957078-20200602164413613-772425579.png

1957078-20200602164434731-59343138.png

注:实验过程中需要不断排除干扰词,以达到既定目标。如:

1957078-20200602164510170-1602376347.png

1957078-20200602164532502-830211036.png

2)血压心率分析

1957078-20200602164607943-352330613.png

代码提示:

1957078-20200602164646007-690041913.png

先用IDLE理解每层代码的含义,再补充剩下的几行代码,最终得出结果。

1957078-20200602164714256-1945473010.png

1957078-20200602164741231-646767110.png

1957078-20200602164807228-2049535540.png

注:注意print输出时的中英文符号。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值