mssql 插入数据缓慢_简单数据分析:探索气候未来发展趋势

5f29502014b191a278471131888f0d56.png

目标:分析本地和全球的气温数据,并比较你居住地的气温走向与全球气温走向。

第一步:

用本身的SQLworkspace 从气温数据库中提取数据,然后将结果下载为 CSV 文件。

我们有三个数据表,分别是:

city_list - 这个表包含数据库中的城市和国家列表。

city_data - 这个表包含每个城市每年的平均气温 (ºC)。

global_data - 这个表包含每年的全球平均气温 (ºC)。

city_list表格里面包含两个字段,城市和国家,我们首先提取出’China’(中国)所有城市列表,代码如下:

SELECT *

FROM city_list

WHERE country = ‘China’;

然后按Download CSV将结果保存在电脑并命名为city_list_china.CSV。

city_data表里包含有年份,城市,国家,以及平均气温这四个字段,我们在这个表里选择所在的城市’Xian’(西安)的平均气温来分析,代码如下:

SELECT *

FROM city_data

WHERE city = ‘Xian’;

然后按Download CSV将结果保存在电脑并命名为city_data_xian.CSV。

global_data表里包含年份,以及平均气温两个字段,我们将所有字段数据列出,代码如下:

SELECT *

FROM global_data;

然后按Download CSV将结果保存在电脑并命名为global_data.CSV。

第二步:

使用EXCEL工具来对数据表进行分析。

首先用EXCEL打开global_data.CSV。

为了便于操作,将文件另存为EXCEL专用格式global_data.xlsx,我们看到表格中有两个字段:year,avg_temp,为了便于阅读,我们新建复制工作表Sheet2并将其字段名改为中文名称:年份,年均气温。并新建“平均气温”字段列,我们以每十年为一个取值区间来做平均:

b6c72c12cdac2825211093297edb8d3c.png

公式为:C11=AVERAGE(B2:B11)

然后拖动将公式应用到C列所有行中(快捷方式光标在C11单元格右下角变为十字时双击鼠标左键)。

在实现可视化当中,我考虑的关键是第一,怎么样呈现会比较直观明了,第二,各坐标的值取哪一个,第三,工具的选择,EXCEL对于各种透视及拆线表等都比较合适。

然后我们先看看全球的年均气温变化情况,以移动平均的值作为纵坐标参数,年份为横坐标,插入拆线图,如下所示:

96163662ccc2ebcbcf20cec2721153c1.png

这里我们取的温度为移动平均值,可以看出世界温度的变化,从1759年开始(因为移动平均值以十年为计算周期所以从这年开始),世界平均的温度整体上呈现一个波动后缓慢上升的趋势,其中在1814-1819年间温度到达底谷,之后逐渐上升,目前仍处在上升的趋势中。

然后再用EXCEL打开city_data_xian.CSV.

首先同样另存为EXCEL专用格式city_data_xian.xlsx,方便后面编辑。

表格中有四个字段:year,city,country,avg_temp,为了便于阅读,我们新建复制工作表Sheet2并将其字段名改为中文名称:年份,城市,国家,年均气温,平均气温。并新建“移动平均”字段列,我们以每十年为一个取值区间来做平均,注意到西安的数据中有个别缺失,我取前后的平均值来填充。

385e8ea4e092d4175fdbdbfb02349860.png

公式为:E11=AVERAGE(D2:D11)

然后拖动将公式应用到E列所有行中(快捷方式光标在E11单元格右下角变为十字时双击鼠标左键)。

同样我们来看看西安的温度变化拆线图,以移动平均的值作为纵坐标参数,隐藏前面空值,年份为横坐标,插入拆线图,如下所示:

c71fa1f0aa8534cbeb4b989636e78c36.png

这里温度同样取移动平均值,可以看出西安的温度变化,1833至1841年间温度升高很快,升高了接近1.5度,然后在1845年后又突然下降的很厉害,跌回到升高前的值,甚至更低,之后开始缓慢的总体上升的趋势变化,有两个明显的升高区间,一是1913年左右至1949年一个快速升高区间,另外就是1993年左右至2005年左右这个区间升高很快,至2013年已经接近历史上曾经的最高值了。

然后我们再来将西安的温度跟全球整体的放在一起来分析比较,将两个表格内数据合并组合到一起,操作步骤:

新建工作表并命名为global_xian_data.xlsx,将global_data.xlsx跟city_data_xian.xlsx数据复制拼接到global_xian_data.xlsx,需要注意的是西安的数据年份比世界整体的少,所以要注意同时将年份对应好,然后在当前表新建工作表SHEET命名为globxian。

在实现可视化当中,我考虑的关键是第一,两个数据要按年份相对应,第二,两个值拆线要明显对比。

然后我们插入拆线图,将西安的平均温度与全球的平均温度放在一张表格上来比较:

eff2aeae2c501ff1bbd559024adf3cbb.png

因为city_xian.CSV中数据年份是从1820年开始的,取移动平均值后从1829年开始,所以整体年份取从1829年开始的值。

总结:

从图表中可以看出来:

1.相对来说,西安的平均气温总是高于世界的平均气温的,并且越来越热。

2.同时比起世界气温的变化来说,西安的气温变化波动更加明显,并且在1837年左右至1849年左右西安的气温变化趋势跟世界整体的趋势几乎相反,这个异常是值得进一步了解的问题。

3.除此之外,世界温度的变化整体上跟西安的温度变化情况趋势一样,就是整体上呈现缓慢增长的态势,那就是越来越热了。

4.西安的温度变化曲线与世界的变化曲线逐渐步调一致起来。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值