美国波士顿犯罪数据数据分析
在kaggle找了个数据集来做数据分析练习,分析得不一定规范
导入库
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import time
from folium import Map
from folium.plugins import HeatMap
folium是一个地理信息可视化库,这里我用作画热力图
读入数据
读入数据,再查看一下每一年有多少条数据
crime = pd.read_csv(open(path+'crime.csv', encoding='windows-1252'))
crime['YEAR'].value_counts()
输出:
2017 100886
2016 99114
2018 65685
2015 53388
Name: YEAR, dtype: int64
18年和15年得数据不完整,所以这里就简单的去掉
crime=crime[crime['YEAR'].isin([2016,2017])]
数据可视化&简单分析
16年和17年的犯罪总数
plt.figure(figsize=(12,6))
sns.countplot(x='YEAR',data=crime)
plt.show()
输出:
count2017,count2016=crime['YEAR'].value_counts()
print('2017犯罪总数环比增长'+str(round((count2017-count2016)/count2016*100,2))+'%')
输出:
2017犯罪总数环比增长1.79%
筛选出感兴趣的犯罪类型
interest=['Missing Person Reported','Robbery','Drug Violation','Prostitution','Harassment']
crimeinterest=crime[crime['OFFENSE_CODE_GROUP'