CSV文件与数据处理
学习书籍:《python编程 从入门到实践》
用到的python模块:csv、matplotlib、datetime
两种常见格式存储的数据:CSV和JSON
本篇看CSV。
- 文件资源:ituring.cn/book/1861 在右侧的"随书下载“的《Python编程》源代码文件-更新.zip Chap16中。
- CSV是指将一系列数据以逗号分隔
如2014-1-5,61,44,26,18,-1,,,0.00,195 - 代码表示对 阿拉斯加锡特卡地区的温度变化数据 进行可视化
import matplotlib.pyplot as plt
import csv
from datetime import datetime
filename = 'sitka_weather_07-2014.csv'
with open(filename) as f:
# 创建阅读器对象my_reader
my_reader = csv.reader(f)
# 读取第一行数据,结果存在变量(列表)first_row中
first_row = next(my_reader)
# 打印首行信息及位置
for index, data in enumerate(first_row):
print(index, data)
# 存储7月每天的最高和最低气温
highs = []
lows = []
# 存储每天日期
dates = []
# 此时,阅读器读完第一行,从第二行数据开始读
# 从第一行信息中发现“最高气温”在第2列,下标为1
# “日期”在第1列,下标为0.
# 用datetime类中的strptime()方法将日期字符串转化为日期对象
for row in my_reader:
high = int(row[1])
low = int(row[3])
date = datetime.strptime(row[0], '%Y-%m-%d')
highs.append(high)
lows.append(low)
dates.append(date)
print(highs)
print(lows)
# 可视化
fig = plt.figure(figsize=(10, 6))
# alpha指颜色的透明度 0表示透明,1(默认)表示完全不透明
plt.plot(dates, highs, c='red', alpha=0.5)
plt.plot(dates, lows, c='blue', alpha=0.5)
# 填充最高气温和最低气温之间的区域 通过着色突出每天的气温范围
plt.fill_between(dates, highs, lows, facecolor='blue', alpha=0.1)
plt.title('Daily high and low temperatures in July,2014', fontsize=24)
plt.xlabel('', fontsize=16)
fig.autofmt_xdate() # 绘制斜的日期标签
plt.ylabel('Temperature(F)', fontsize=16)
plt.tick_params(axis='both', labelsize=16)
plt.show()
# plt.savefig('July Temperature(final)', bbox='tight')
执行结果:
未填充最高温和最低温之间区域时:
备注:也可以使用2014年全年的数据进行操作。
文件名:filename = 'sitka_weather_2014.csv'