台风最喜欢在我国哪个省市登陆!我用Python来告诉你!

【前言】

每年夏季,台风就如期而至。今年八月份,“风王”利奇马真的如脱缰野马,让大家见识到台风的可怕之处。

这次收集到1945~2015年在中国登陆的所有台风数据,并通过Python对这些数据进行可视化分析,希望能得到一些有意思的结论。

【数据来源】

该数据集来自于上海追风团队,在其官网台风数据中心下载。

网站提到某些数据年代久远,会有缺失和误差,请甄别使用。所以这里无法对数据的精确性和完整性做保证,主要是想运用python对数据做分析展示,看看台风在等级、地点、时间上的分布。杠精勿扰~

部分数据展示

【分析工具】

本文使用python及其第三方库做分析展示,分析平台是Jupyter notebook,用到爬虫、词云、可视化、地理空间分析等技术。

主要工具:Python 3.6、pandas、numpy、matplotlib、seaborn、urllib、geopandas、wordcloud

 

【分析流程】

1、导入相关库

# 导入相关库
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import geopandas 
import seaborn as sns
from urllib import request
import re
from shapely.geometry import LineString,Point
from urllib import parse
from urllib.request import urlopen
import hashlib
import json
from wordcloud import WordCloud
import warnings
warnings.filterwarnings('ignore')
# 显示中文标签
plt.rc('font', family='SimHei', size=18)
sns.set()
%matplotlib inline

2、加载数据集

# 加载台风数据
data = pd.read_excel(r'case\taifeng.xlsx')
# 数据规格
data.shape
# 输出:(715, 7)

3、查看数据集

# 查看后10行
data.tail(10)

4、数据整理

我们可以看到数据集里只有登陆地址,没有确切的经纬度信息 。

这里需要通过地理编码的方式获取经纬度,使用的是百度地图API。

# 地理编码,通过登陆地址信息得到经、纬度
def get_coor(address):
    # 需填入自己申请应用后生成的ak
    ak = 'mcH6sBNaAfsbkSndFI5zO90j9wUpRMFy1'
    url = 'http://api.map.baidu.com/geocoder/v2/?address='
    output = 'json'
    add = parse.quote(address)  # 本文城市变量为中文,
  • 4
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值