
探索未来气候发展趋势项目
概览
在这个项目中,我将分析广州和全球的气温数据,并比较广州气温走向与全球气温走向,形成可视化的分析报告。
说明
本次分析将按照:
- 采集数据
- 整理数据
- 创建图像
- 观察分析
- 得出结论
的步骤进行研究分析,试用SQL语言和r语言画图工具进行数据可视化。
步骤详解
1.采集数据(SQL)
- 确认城市 查询数据库中的中国城市。试用如下代码在网页中查询相关数据:
SELECT *
FROM city_list
WHERE country = 'China'
由于答主所在城市为深圳,纵观全表,广州为表中距离最近城市,所以将广州选为全球气候的对比城市。
- 提取广州市和全球相同年份平均气温值
SELECT c.year, c.avg_temp as city_temp, g.avg_temp as global_temp
FROM city_data c, global_data g
WHERE c.year = g.year
AND c.city = 'Guangzhou'
保存数据到result.xls文件。
2. 整理数据(excel)
我们将生成的xls文件通过excel形成初步的观测图像,如下(为突出两组数据的走向,右侧增加了次坐标轴作为参考):

由图中可观测到,两组数据在未经过处理前,形成的曲线波动较大,难以看出明显的运动趋势; 这里我们选择使用移动平均法对两组数据的曲线进行平滑处理,以使曲线运动趋势更加明显,更易观测; 我们知道,移动平均数的N值越大,曲线越平滑,但也使折线图的一些细节被埋没。根据经验,我们取N=10,作为移动平均值的处理周期,既保证观察到更多局部的波动,又突出长远趋势。 通过excel中的average函数对两组原始数据进行处理。
3. 形成图表(excel)
- 经过整理后,形成了两幅图表的10年移动平均值图像。如下:

4. 观察分析
观测平滑处理后的折线图,我可以初步得出以下结论: 整体而言,全球平均气温逐年递增,世界是越来越热的; 整体而言,广州市平均气温逐年递增,广州市也是越来越热的; * 广州市的平均气温高于同期全球平均气温;
同时我又产生了以下几个问题,它们是: 广州市平均气温与全球气温变动有一定的相关性吗?(从移动平均值曲线基本平行推断得出); 在2019年,广州市平均气温大约会达到多少?
5.进一步验证(excel)
- 针对第一个问题,我使用excel中的【数据分析】加载项中的【相关系数】,对全球平均气温和广州市平均气温原始数据进行分析,得到以下内容:

可知,两组原始数据的相关系数约为0.758,证明两组数据具有较高的相关性。
- 针对第二个问题:通过之前的观测发现,数据具有明显的上升趋势,明显的趋势变动的时间序列,于是我选择通过holt指数平滑法进行分析,主要使用excel的【数据分析-回归】和【规划求解】功能进行。涉及到公式为:

1) 整理数据,将日期栏按照序列加工为“1、2、3、4、……174”,通过回归计算得以下内容:

2) 确认初始trend和level(分别对应Coefficients的1、2行),然后根据以上公式计算出forcast.ft值,如图:

3) 根据结果计算出,计算预测值与实际值差异error.er,差异平方error².er²,绝对差异,以及平均绝对差异,再根据差异值计算出均方误差MSE,如图:

4) 最后通过规划求解,求得MSE最小时的α和β组合,注意,这里设定α和β<=1,如图:

得到在MSE最小时,α≈0.1452,β= 0,此时预测到的2019年广州市平均气温为22.29℃。如图

6. 得出结论
- 整体而言,全球平均气温逐年递增,世界是越来越热的;
- 整体而言,广州市平均气温逐年递增,广州市也是越来越热的;
- 广州市的平均气温高于同期全球平均气温;
- 广州市平均气温与全球气温变动有一定的相关性,相关系数约为0.758;
- 在2019年,广州市平均气温大约会达到22.29℃。