本文地址https://blog.csdn.net/sidens/article/details/80710006,转载请说明
使用网上下载的CSV文件,利用matplotlib生成可视化图表
以下代码实现sitka最高气温与最低气温的可视化
import csv
import matplotlib.pyplot as plt
from datetime import datetime
import numpy as np
#给出文件路径,相对路径
file_path = r'resources_in_PythonCrashCrouse\sitka_weather_2014.csv'
with open(file_path) as f:
reader = csv.reader(f)#reader只能在文件关闭前使用
#读取数据标题行,同时将reader文件“指针”下移一行
header_row = next(reader)
dates,max_temperatures,min_temperatures = [],[],[]
#从文件中读取的数据以字符串形式存在,为方便画图转换为整型
for row in reader:
try:#处理文件出现的各种异常
current_date = datetime.strptime(row[0],'%Y-%m-%d')
max_temperature = int(row[1])
min_temperature = int(row[3])
except ValueError:
print(current_date,'missing data')
else:
dates.append(current_date)
max_temperatures.append(int(row[1]))
min_temperatures.append(int(row[3]))
#设置输出图形大小
fig = plt.figure(dpi=80,figsize=(10,6))
#使能图例 ,alpha表示透明度,1表示不透明
plt.plot(dates,max_temperatures,c='red',label=u'max_temperature')
plt.plot(dates,min_temperatures,c='blue',label=u'min_tempeerature')
plt.fill_between(dates,min_temperatures,max_temperatures,facecolor='blue',alpha=0.1)
plt.legend()
plt.title('max and min temperatures in Sitka in 2014')
plt.xlabel('date')
plt.ylabel('max_temperature(F)')
#设置坐标轴字体
# plt.tick_params(axis='both',which='major',labelsize=16)
#设置日期斜放格式
fig.autofmt_xdate()
#设置日期斜放格式,还可设置坐标轴刻度
#plt.xticks(rotation=17)
plt.show()
输出图像如图
主要有以下几点需要注意:
1.网上下载的数据往往存在数据缺少等情况,应充分考虑对应情况引发的异常,以及这些异常应如何处理
2.读取CSV文件时,使用reader()方法得到的文件对象只能在文件打开时使用
3.从文件中读取的数据以字符串的形式存储
4.plt.plot()方法中的label参数表示图例,指定图例后调用plt.legend()方法即可激活图例
5.让x轴刻度值倾斜有两种方法,fig.autofmt_xdate()以及plt.xtick(rotation=),其中plt.xtick()方法还可设置与x轴相关的很多属性
以下代码实现sitka与death valley最高气温与最低气温的比较
import csv
import matplotlib.pyplot as plt
from datetime import datetime
import numpy as np
#给出文件路径,相对路径
file_path_sitka = r'resources_in_PythonCrashCourse\sitka_weather_2014.csv'
file_path_death_valley = r'resources_in_PythonCrashCourse\death_valley_2014.csv'
def read_CSV_data(filename,dates,max_temps,min_temps):
"""从CSV文件读取数据"""
with open(filename) as f:
reader = csv.reader(f)#reader只能在文件关闭前使用
#读取数据标题行,同时将reader文件“指针”下移一行
header_row = next(reader)
#从文件中读取的数据以字符串形式存在,为方便画图转换为整型
for row in reader:
try:#处理文件出现的各种异常
current_date = datetime.strptime(row[0],'%Y-%m-%d')
max_temp = int(row[1])
min_temp = int(row[3])
except ValueError:
print(current_date,'missing data')
else:
dates.append(current_date)
max_temps.append(int(row[1]))
min_temps.append(int(row[3]))
if __name__ == '__main__':
#读取数据
dates_sitka,dates_death_valley = [],[]
max_temps_sitka,max_temps_death_valley = [],[]
min_temps_sitka,min_temps_death_valley = [],[]
read_CSV_data(file_path_sitka,dates_sitka,max_temps_sitka,min_temps_sitka)
read_CSV_data(file_path_death_valley,dates_death_valley,max_temps_death_valley,min_temps_death_valley)
#设置输出图形大小
fig = plt.figure(dpi=80,figsize=(10,6))
#使能图例 ,alpha表示透明度,1表示不透明
plt.plot(dates_sitka,max_temps_sitka,c='red',label=u'max_temperature_sitka')
plt.plot(dates_sitka,min_temps_sitka,c='blue',label=u'min_temperature_sitka')
plt.fill_between(dates_sitka,min_temps_sitka,max_temps_sitka,facecolor='blue',alpha=0.1)
plt.plot(dates_death_valley,max_temps_death_valley,'r--',label=u'max_temperature_death_valley')
plt.plot(dates_death_valley,min_temps_death_valley,'g--',label=u'min_temperature_death_valley')
plt.fill_between(dates_death_valley,min_temps_death_valley,max_temps_death_valley,facecolor='blue',alpha=0.1)
plt.legend()
plt.title('the difference between Sitka and Death Valley in max and min temperatures in 2014')
plt.xlabel('date')
plt.ylabel('max_temperature(F)')
#设置坐标轴字体
# plt.tick_params(axis='both',which='major',labelsize=16)
#设置日期斜放格式
fig.autofmt_xdate()
#设置日期斜放格式,还可设置坐标轴刻度
#plt.xticks(rotation=17)
plt.show()
输出如图所示: