2018江西省数学建模A题:第一问中关于按季度统计数据的一种解决办法。
即本文解决的问题是:把原始数据中得过敏性疾病的患者数据提取出来,并按照每年的四季分类,最终得出分类数据,并画出按四季分类的直方图。
1、从excel读取数据:
import numpy as np
import pandas as pd # 导入pandas库
file_directory = "2018年过敏统计信息表 A题附件.xls" #原始数据的文件名
data = pd.read_excel(file_directory,sep='\t',parse_dates=['检测日期']) #读取数据,并保存到data中
2、清洗数据:
# 根据观察的信息,清洗数据
# 清除无用的列
data.drop(['Unnamed: 21'], axis=1,inplace=True) #删除Unnamed: 21列(即最后一列)
# 清除无用的列
data_drop=data.dropna(axis=0, how='any') # Remove missing values. 删除有过敏原有空值的那一行
print(list(data)) # 标题 显示验证最后一列Unnamed被删除
print('清洗前数据行数:',len(data)) # 数据行数(2284)
print('数据清洗后长度:',len(data_drop)) # 数据长度(2267)
len(data)- len(data_drop)# 去掉无