坐标苏州,来这边刚好一年的时间,又到四月,梅雨季节(?)最能感受到烟雨江南的朦胧美,才怪!实际上的心情是,“清明时节雨纷纷,放假宅家欲断魂”,已经无力吐槽这春夏交战冬天突围的诡异天气变化了,正好有时间,所以想用高大上的技术语言来解读一下苏州的天气特点。
历史天气数据来源:http://tianqi.2345.com/wea_history/54511.htm,这是北京的历史数据,采样城市北京、上海、苏州、长沙、广州、一共采集了2011-1-1到2015-4-2这四年三个月共1542(354+366+365+365+92)天的天气数据,其中2011-1-17到2011-1-25这十天的数据缺失,查了多个网站都发现这种情况,就没有把数据补齐了。另外,上海、苏州、广州这三个城市2012-1-15这天,长沙2015-2-10这天,五个城市2014-3-8这天的数据缺失,这里根据前后两天的温度取平均值,天气定为阴,风向后风级都根据前后天补齐。下面两个图是在两个不同的网站上查到的历史天气数据都是有缺失的。
将数据做完清洗整理后,存做csv格式,数据输入R中,并查看数据基本结构如下:
beijing <-read.csv("BeiJing.csv",header=T,stringsAsFactors=FALSE)
changsha <-read.csv("Changsha.csv",header=T,stringsAsFactors=FALSE)
guangzhou <-read.csv("GuangZhou.csv",header=T,stringsAsFactors=FALSE)
shanghai <-read.csv("ShangHai.csv",header=T,stringsAsFactors=FALSE)
suzhou <-read.csv("SuZhou.csv",header=T,stringsAsFactors=FALSE)
head(suzhou,n=5)
每一列分别是:date(日期)、highestTemp(最高温度)、lowest(最低温度)、weather(天气)、wind(风向)、windForce(风级)。
天气篇
</