前言:最近在mooc听北大郭炜老师的《实用Python程序设计》,意在补充编程知识并为建模做准备。本以为可以吃竞赛的老本,不怎么费力也能一马平川,可真正做题才发现还得踏踏实实慢慢来。语言的学习是一个熟能生巧的过程,光学不练肯定是不能留有深刻印象从而一学就忘。课程前七章涉及的是基本语法和数据类型的介绍,大都可类比c语言,再加上在openjudge上刷刷题,没有太大问题。进入文件处理这一章,突然就感到有点懵圈,这可能就是理论和迈入实践的差别吧。郭老师在课上说的一句“我们不可能总在oj上处理实际问题吧”点醒了我。自初三接触编程以来,我早已养成了这样一种“oj思维”,以oj刷题为乐,对实际有用的文件处理等不屑一顾。如今才明白,之前学的所谓的计算机竞赛实际用途并不大,真正有用的是学好文件处理等能够真正用到电脑上的东西。如此看来,任重而道远啊!
题目简介&分析:
这道题是郭老师留下的互评作业。要求是根据id.txt和finalscore.txt生成特定格式的学生成绩。id.txt每行两个数据,分别是学生的id和姓名。finalscore.txt则较为复杂,里面放着学生的做题信息,每行第一个数据表示排名,第二个数据是学生的昵称(可能是姓名可能是id有可能都有),之后是学校名称(有可能没有),之后是做题数量和每道题的答题情况。学生成绩的计算方法完全取决于做题的数量,所以对于finalscore.txt,我们需要提取的只是学生的id或者姓名以及做题数量。
1. 文件处理基本知识
与c语言类似,需要有一个文件指针来指向对应的文件,再通过相应的函数进行读写操作。
下面来大致总结一下c语言和python文件基本操作函数
FILE *fp;
fp=fopen("id.txt","a");
fscanf(fp,"%d",&x);
sprintf(fp,"hello");
fclose(fp);
c语言通过指针来处理,而python的处理方式也如出一辙,例如打开一个文件:f=open("id.txt","r") 也是由文件名+文件类型组成。其余操作也类似。
f=open("id.txt","a")
s=f.readlines()
f.write("hello")
f.close()
注意,python的文件读入有三种方式:
f.readline() 读取一行,返回字符串
f.readlines() 读取全部内容,返回一个列表,其中每一行生成一个字符串存入列表中
f.read() 读取全部内容,返回一个字符串
除了文件的读写,还应注意文件的编码。文本文件是有编码的,常见的有两种,utf-8和gbk。打开文件时如果编码不对,则无法打开相应的文件。这道题里面的文件都是utf-8编码的,所以为了保险,在打开时需要把编码加上,例如:
f=open("id.txt","r",encoding='utf-8')
2.数据处理
题目的意思很明确,先存储每个学生的id和姓名,再根据id的大小顺序进入finalscore里面查找到该学生的做题情况,并输入到ans文件里面。
首先对于id.txt文件,可用readline的方式一行一行地读入并存到列表中,也可直接用readlines的方式作为字符串存储(因为id在前,所以不影响排序),再进行sort排序即可。
排好序后,把每个学生的id和姓名都放入finalscore中查找的话显然是有点复杂了。这里可以先把finalscore的数据用readlines读出来,然后到字符串里面去查找。如果找到了,那么将对应的字符串split(分割符是制表符\t),提取出做题数量(split之后,第四个数据是做题数量,这个需要分析一下);如果没找到则成绩记为0。
注意输出的时候也需要用制表符隔开而不是空格,这样才能够直接复制粘贴到excel文件中。
以上就是这道题的完整分析,其实思路挺简单,处理起来也不复杂,主要是对文件处理的熟悉。代码如下:
import re
def find(x,y):
l=len(y)
for i in range(l):
if x in y[i]:
return i
return -1
def score(x):
if x==0:
return 0
elif x==1:
return 50
elif x==2:
return 60
else :
return 60+4*(x-2)
def max(x,y):
if x>y:
return x
else :
return y
f=open("id.txt","r",encoding='utf-8')
id=f.readlines()
id.sort()
f.close()
f=open("finalscore.txt","r",encoding='utf-8')
final=f.readlines()
f.close()
f=open("an.txt","w",encoding='utf-8')
f.write("学号\t姓名\t题数\t分数\n")
for x in id:
s1,s2=x.split()
m1=find(s1,final)
m2=find(s2,final)
if m1==-1 and m2==-1:
f.write("%s\t%s\t%d\t%d\n"%(s1,s2,0,0))
else :
m=max(m1,m2)
l=re.split('\t',final[m])
n=int(l[3])
ans=score(n)
f.write("%s\t%s\t%d\t%d\n"%(s1,s2,n,ans))
f.close()