16-6 重构
在从all_eq_dicts中提取数据的循环中, 使用了变量来指向震级, 经度, 纬度和标题, 再将这些值分别附加到相应列表的末尾. 这意在清晰地演示如何从JSON文件中提取数据, 但并非必须这样做. 你也可以不使用这些临时变量, 而是直接从eq_dict中提取数据, 并将其附加到相应列表末尾. 这样做将缩短这个循环体, 使其只包含4行代码.
思考: 需要缩短循环体, 显眼是利用书本
4.3.4 列表解析
所学知识点
源程序为:
mags, titles, lons, lats = [], [], [], []
for all_eq_dict in all_eq_dicts:
mag = all_eq_dict['properties']['mag']
title = all_eq_dict['properties']['title']
lon = all_eq_dict['geometry']['coordinates'][0]
lat = all_eq_dict['geometry']['coordinates'][1]
mags.append(mag)
titles.append(title)
lons.append(lon)
lats.append(lat)
利用列表解析修改为:
mags = [all_eq_dict['properties']['mag'] for all_eq_dict in all_eq_dicts]
titles = [all_eq_dict['properties']['title'] for all_eq_dict in all_eq_dicts]
lons = [all_eq_dict['geometry']['coordinates'][0] for all_eq_dict in all_eq_dicts]
lats = [all_eq_dict['geometry']['coordinates'][1] for all_eq_dict in all_eq_dicts]
练习16-7: 自动生成标题
本节定义my_layout 时以手工方式指定标题, 这意味着每次变更源文件时, 都需要修改标题. 你可以不这样做, 而是使用JSON文件中元数据(metadata) 部分的数据集标题. 为此, 可提取这个值, 将其赋给一个变量, 并在定义my_layout 时使用这个变量来指定散点图的标题.
源程序:
fig = px.scatter(
data,
x='经度',
y='纬度',
range_x=[-200,200],
range_y=[-90,90],
title='全球地震散点图',
width=800,
height=800,
size='震级',
size_max=10, # 标记尺寸默认为20,这里调整为10
color='震级', # 默认的视觉映射图例渐变色范围是从蓝到红再到黄,数值越小颜色越蓝
color_continuous_scale=px.colors.qualitative.Alphabet, # 颜色变化
hover_name='位置'
)
修改后:
fig = px.scatter(
data,
x='经度',
y='纬度',
range_x=[-200,200],
range_y=[-90,90],
title=all_eq_data['metadata']['title'],
width=800,
height=800,
size='震级',
size_max=10, # 标记尺寸默认为20,这里调整为10
color='震级', # 默认的视觉映射图例渐变色范围是从蓝到红再到黄,数值越小颜色越蓝
color_continuous_scale=px.colors.qualitative.Alphabet, # 颜色变化
hover_name='位置'
)
练习 16-8 最近发生的地震
最近发生的地震 请在本书配到资源中找到关于最近1小时, 1天, 7天和30天内地震信息的数据文件, 请使用其中一个数据集, 绘制一个散点图来展示最近发生的地震.
本题推荐使用
Jupyter Notebook
来分步完成, 过程将更加直观画图推荐利用
plotly.express.density_mapbox
或者plotly.graph_objects.Densitymapbox
, 书本直接利用散点图有点太粗暴
import json
# 找到文件,将文件数据转换为Python能够处理的格式
filename = 'data/eq_data_30_day_m1.json'
with open(filename) as f:
all_eq_data = json.load(f) # json.load()将数据转换为Python能够处理的格式
all_eq_dicts = all_eq_data['features']
# print(len(all_eq_dicts)) # 这里打印结果为158,说明一共记录了158次地震,数据量较大
# 利用列表解析从JSON文件中提取数据,并将这些值分别附加到相应列表的末尾
mags = [all_eq_dict['properties']['mag'] for all_eq_dict in all_eq_dicts]
titles = [all_eq_dict['properties']['title'] for all_eq_dict in all_eq_dicts]
lons = [all_eq_dict['geometry']['coordinates'][0] for all_eq_dict in all_eq_dicts]
lats = [all_eq_dict['geometry']['coordinates'][1] for all_eq_dict in all_eq_dicts]
# 利用pandas数据分析工具,创建一个DataFrame, 将所需要的数据封装起来
import pandas as pd
data = pd.DataFrame(
data=zip(lons, lats, titles, mags), columns=['经度', '纬度', '位置', '震级']
)
data.head()
# 画图
import plotly.express as px
fig = px.density_mapbox(data, lat='纬度', lon='经度', z='震级', hover_name='位置', radius=5,
center=dict(lat=0, lon=180), zoom=0,
mapbox_style="stamen-terrain")
fig.show()
练习16-9 全球火灾
在本章配套资源中, 有一个名为 world_fires_1_day.csv 的文件. 它包含了有关全球各地发生的火灾信息, 包括经纬度和火灾强度(brightness). 使用16.1 节介绍的数据处理技术以及16.2节介绍的散点图绘制技术, 绘制一幅散点图来展示全球哪些地方发生了火灾.
思路跟上题完全一致, 只是上次我们用
plotly.express.density_mapbox
画图, 这次试下plotly.graph_objects.Densitymapbox
首先先导入所需库, 并看看数据文件是否需要预处理
import plotly.graph_objects as go
import pandas as pd
data = pd.read_csv('./data/world_fires_1_day.csv')
data.head()
显然数据非常规整,我们来直接画图
fire_map = go.Densitymapbox(lat=data['latitude'], lon=data['longitude'], z=data['brightness'], radius=4)
fig = go.Figure(fire_map)
fig.update_layout(mapbox_style="open-street-map")
fig.show()