目录
链接:数据集
提取码:6666
1.任务要求
- 理解两个文件“deaths.xlsx”和“icd-main.xlsx”的数据结构,通过编程查看文件内容和信息。筛选出2007和2008年两年的个体死亡数据,并去掉无效数据,保存为文件“death0708.csv”。
- 从文件“death0708.csv”读取数据,分组统计不同死亡原因导致的死亡人数,并与“icd-main.xlsx”连接,保存为文件“cause-deaths.csv”。
- 从文件“death0708.csv”读取数据,分组统计不同时刻的死亡人数,计算每个时刻死亡人数占比,并把占比数据增加为一列,保存为文件“hour-deaths.csv”。根据百分比画出折线图,横坐标是一天的24小时,总坐标是百分比。
- 对结果进行评价,得出结论。并说明这些结果对于社会、健康、安全、法律以及文化的影响。
2.流程图
2.1 第一题流程图
图2.1 第一题流程图
2.2第二题流程图
图2.2 第二题流程图