习题1:读入文件pmi_days.csv,完成以下操作:
1.统计质量等级对应的天数,例如:
优:5天
良:3天
中度污染:2天
2.找出PMI2.5的最大值和最小值,分别指出是哪一天。
import pandas as pd import numpy as np days_path = open(r"C:\python 1\pmi_days.csv") days_df = pd.read_csv(days_path) data = days_df.groupby('质量等级') day_you = dict([x for x in data])['优'] day_liang = dict([x for x in data])['良'] day_qing = dict([x for x in data])['轻度污染'] day_zhong = dict([x for x in data])['中度污染'] print("优:%d天" % len(day_you.index), "\n良:%d天" % len(day_liang.index), "\n轻度污染:%d天" % len(day_qing.index), "\n中度污染:%d天" % len(day_zhong.index)) sort_pm25 = days_df.sort_values(by='PM2.5') sort_pm25_2 = sort_pm25.reset_index(drop=True) print("PM2.5最大的一天是:%s,数值:%d" % (sort_pm25_2['日期'][29], sort_pm25_2['PM2.5'][29]), "\nPM2.5最小的一天是:%s,数值:%d" % (sort_pm25_2['日期'][0], sort_pm25_2['PM2.5'][0]))
习题2:读入文件1980-2018GDP.csv,完成以下操作:
1.按行输出每年GDP数据,表头列名如文件第1行所示。
2.将各年GDP数据转换成字典格式,以年份为keys,其它值为values(数据类型为列表方式),例如:
{
2017:[827121.7,6.8%,60989]
........
}
3.遍历字典数据,求出GDP的最小值与最大值,并输出数据与对应的年份。
import pandas as pd path = open(r"C:\python 1\1980-2018GDP.csv") list = pd.read_csv(path) # 1.按行输出每年GDP数据 print(list, "\t\t\n") # 2.将各年GDP数据转换成字典格式,以年份为keys,其它值为values(数据类型为列表方式) GDP = list.set_index('年份').T.to_dict('list') print("字典:", GDP, "\n") # 3.遍历字典数据,求出GDP的最小值与最大值,并输出数据与对应的年份。 data_max = max(GDP, key=GDP.get) data_min = min(GDP, key=GDP.get) print("GDP最大值:", data_max, GDP[data_max], "\n") print("GDP最小值:", data_min, GDP[data_min])