gpt-4o很牛!
今天教务处要求我分析考试成绩的平均分和三率。原先是用 SQL 存储过程处理的,但今天准备用电子表格来处理。后来想到了 gpt-4o 模型,我输入了一些提示信息,经过几次迭代,生成了下面这段程序。经测试结果正确。
以下程序我没有写一句,全由gpt-4o生成。
程序运行环境
pip install pandas openpyxl
将电子表格文件命名为'grades.xlsx', 与程序放在一个目录下,后续写一个GUI,直接来选择,前两列['班级名称', '姓名'],自己可以修改
表结构如下:
import pandas as pd
# 读取grades.xlsx文件
grades_df = pd.read_excel('grades.xlsx')
# 获取所有成绩列(假设前两列是班级名称、姓名,后面的是科目成绩)
score_columns = [col for col in grades_df.columns if col not in ['班级名称', '姓名']]
# 提示用户输入考试名称
exam_name = input("请输入考试名称:")
# 提示用户输入每科目的满分
subject_full_marks = {}
for subject in score_columns:
while True:
try:
max_score = float(input(f"请输入 {subject} 的满分(例如 120):"))
subject_full_marks[subject] = max_score
break
except ValueError:
print("无效的输入,请输入一个数字。")
# 定义分数比例
excellent_ratio = 0.8 # ≥ 80% 算为优秀
pass_ratio = 0.6 # ≥ 60% 算为合格
low_ratio = 0.3 # ≤ 30% 算为低分
# 定义一个函数来计算每个班级各科成绩的优秀率,合格率,低分率,和平均分
def calculate_class_metrics(df, subject, max_score, excellent_ratio, pass_ratio, low_ratio):
results = []
for class_name, group in df.groupby('班级名称'):
total_students = len(group)
excellent_threshold = max_score * excellent_ratio
pass_threshold = max_score * pass_ratio
low_threshold = max_score * low_ratio
excellent_count = (group[subject] >= excellent_threshold).sum()
pass_count = (group[subject] >= pass_threshold).sum() # 包括优秀的学生
low_count = (group[subject] <= low_threshold).sum() # ≤ 满分 * 0.3
excellent_rate = excellent_count / total_students
pass_rate = pass_count / total_students # 合格率包括优秀的学生
low_rate = low_count / total_students # 低分率包括 ≤ 30%的学生
average_score = group[subject].mean()
results.append({
'班级名称': class_name,
'优秀率': excellent_rate,
'合格率': pass_rate,
'低分率': low_rate,
'平均分': average_score
})
return pd.DataFrame(results)
# 创建一个Excel writer对象,并使用考试名称作为文件名
output_filename = f"{exam_name}.xlsx"
with pd.ExcelWriter(output_filename) as writer:
for subject in score_columns:
max_score = subject_full_marks[subject]
metrics_df = calculate_class_metrics(grades_df, subject, max_score, excellent_ratio, pass_ratio, low_ratio)
metrics_df.to_excel(writer, sheet_name=subject, index=False)
print(f"已将 {subject} 的分析结果写入到 '{output_filename}' 中的 {subject} Sheet中")
print(f"所有分析结果已写入 {output_filename} 文件")
代码说明:
-
数据读取:
-
使用
pandas
读取grades.xlsx
文件,获取所有成绩列。
-
-
用户交互输入:
-
使用
input()
函数从键盘输入考试名称,将用作生成文件的文件名。 -
使用
input()
函数从键盘输入每个科目的满分,并保存在subject_full_marks
字典中。
-
-
分数比例定义:
-
分别定义满分比例的优秀、合格和低分的阈值。
-
-
计算函数:
-
calculate_class_metrics()
函数根据每科目满分和阈值计算各项指标(优秀率、合格率、低分率和平均分)。 -
结果以DataFrame形式返回。
-
-
写入Excel:
-
使用
pd.ExcelWriter
创建一个Excel写入对象,并使用用户输入的考试名称作为文件名。 -
遍历所有科目,调用
calculate_class_metrics()
函数计算各科目指标,并分别写入不同的Sheet中。
-
-
输出结果:
-
所有计算结果分别写入到单独的Sheet中,最终生成一个以考试名称命名的Excel文件。
-
在执行时,用户将依次被提示输入考试名称和各科目的满分,脚本会计算每个科目的各项指标,并将结果写入同一个Excel文件的不同Sheet中。每个Sheet对应一个科目。结果文件名称将会是用户输入的考试名称。