![5f29502014b191a278471131888f0d56.png](https://img-blog.csdnimg.cn/img_convert/5f29502014b191a278471131888f0d56.png)
目标:分析本地和全球的气温数据,并比较你居住地的气温走向与全球气温走向。
第一步:
用本身的SQLworkspace 从气温数据库中提取数据,然后将结果下载为 CSV 文件。
我们有三个数据表,分别是:
city_list - 这个表包含数据库中的城市和国家列表。
city_data - 这个表包含每个城市每年的平均气温 (ºC)。
global_data - 这个表包含每年的全球平均气温 (ºC)。
city_list表格里面包含两个字段,城市和国家,我们首先提取出’China’(中国)所有城市列表,代码如下:
SELECT *
FROM city_list
WHERE country = ‘China’;
然后按Download CSV将结果保存在电脑并命名为city_list_china.CSV。
city_data表里包含有年份,城市,国家,以及平均气温这四个字段,我们在这个表里选择所在的城市’Xian’(西安)的平均气温来分析,代码如下:
SELECT *
FROM city_data
WHERE city = ‘Xian’;
然后按Download CSV将结果保存在电脑并命名为city_data_xian.CSV。
global_data表里包含年份,以及平均气温两个字段,我们将所有字段数据列出,代码如下:
SELECT *
FROM global_data;
然后按Download CSV将结果保存在电脑并命名为global_data.CSV。
第二步:
使用EXCEL工具来对数据表进行分析。
首先用EXCEL打开global_data.CSV。
为了便于操作,将文件另存为EXCEL专用格式global_data.xlsx,我们看到表格中有两个字段:year,avg_temp,为了便于阅读,我们新建复制工作表Sheet2并将其字段名改为中文名称:年份,年均气温。并新建“平均气温”字段列,我们以每十年为一个取值区间来做平均:
![b6c72c12cdac2825211093297edb8d3c.png](https://img-blog.csdnimg.cn/img_convert/b6c72c12cdac2825211093297edb8d3c.png)
公式为:C11=AVERAGE(B2:B11)
然后拖动将公式应用到C列所有行中(快捷方式光标在C11单元格右下角变为十字时双击鼠标左键)。
在实现可视化当中,我考虑的关键是第一,怎么样呈现会比较直观明了,第二,各坐标的值取哪一个,第三,工具的选择,EXCEL对于各种透视及拆线表等都比较合适。
然后我们先看看全球的年均气温变化情况,以移动平均的值作为纵坐标参数,年份为横坐标,插入拆线图,如下所示:
![96163662ccc2ebcbcf20cec2721153c1.png](https://img-blog.csdnimg.cn/img_convert/96163662ccc2ebcbcf20cec2721153c1.png)
这里我们取的温度为移动平均值,可以看出世界温度的变化,从1759年开始(因为移动平均值以十年为计算周期所以从这年开始),世界平均的温度整体上呈现一个波动后缓慢上升的趋势,其中在1814-1819年间温度到达底谷,之后逐渐上升,目前仍处在上升的趋势中。
然后再用EXCEL打开city_data_xian.CSV.
首先同样另存为EXCEL专用格式city_data_xian.xlsx,方便后面编辑。
表格中有四个字段:year,city,country,avg_temp,为了便于阅读,我们新建复制工作表Sheet2并将其字段名改为中文名称:年份,城市,国家,年均气温,平均气温。并新建“移动平均”字段列,我们以每十年为一个取值区间来做平均,注意到西安的数据中有个别缺失,我取前后的平均值来填充。
![385e8ea4e092d4175fdbdbfb02349860.png](https://img-blog.csdnimg.cn/img_convert/385e8ea4e092d4175fdbdbfb02349860.png)
公式为:E11=AVERAGE(D2:D11)
然后拖动将公式应用到E列所有行中(快捷方式光标在E11单元格右下角变为十字时双击鼠标左键)。
同样我们来看看西安的温度变化拆线图,以移动平均的值作为纵坐标参数,隐藏前面空值,年份为横坐标,插入拆线图,如下所示:
![c71fa1f0aa8534cbeb4b989636e78c36.png](https://img-blog.csdnimg.cn/img_convert/c71fa1f0aa8534cbeb4b989636e78c36.png)
这里温度同样取移动平均值,可以看出西安的温度变化,1833至1841年间温度升高很快,升高了接近1.5度,然后在1845年后又突然下降的很厉害,跌回到升高前的值,甚至更低,之后开始缓慢的总体上升的趋势变化,有两个明显的升高区间,一是1913年左右至1949年一个快速升高区间,另外就是1993年左右至2005年左右这个区间升高很快,至2013年已经接近历史上曾经的最高值了。
然后我们再来将西安的温度跟全球整体的放在一起来分析比较,将两个表格内数据合并组合到一起,操作步骤:
新建工作表并命名为global_xian_data.xlsx,将global_data.xlsx跟city_data_xian.xlsx数据复制拼接到global_xian_data.xlsx,需要注意的是西安的数据年份比世界整体的少,所以要注意同时将年份对应好,然后在当前表新建工作表SHEET命名为globxian。
在实现可视化当中,我考虑的关键是第一,两个数据要按年份相对应,第二,两个值拆线要明显对比。
然后我们插入拆线图,将西安的平均温度与全球的平均温度放在一张表格上来比较:
![eff2aeae2c501ff1bbd559024adf3cbb.png](https://img-blog.csdnimg.cn/img_convert/eff2aeae2c501ff1bbd559024adf3cbb.png)
因为city_xian.CSV中数据年份是从1820年开始的,取移动平均值后从1829年开始,所以整体年份取从1829年开始的值。
总结:
从图表中可以看出来:
1.相对来说,西安的平均气温总是高于世界的平均气温的,并且越来越热。
2.同时比起世界气温的变化来说,西安的气温变化波动更加明显,并且在1837年左右至1849年左右西安的气温变化趋势跟世界整体的趋势几乎相反,这个异常是值得进一步了解的问题。
3.除此之外,世界温度的变化整体上跟西安的温度变化情况趋势一样,就是整体上呈现缓慢增长的态势,那就是越来越热了。
4.西安的温度变化曲线与世界的变化曲线逐渐步调一致起来。