Crime in Boston
kaggle上对波士顿的案件分析(作者很懒,只上传了一部分)
数据源:https://www.kaggle.com/ankkur13/boston-crime-data
一:基本信息查看
#导入数据模块
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
#加载数据
df=pd.read_csv(r"C:\Users\willow\Desktop\boston-crime-data\crime.csv",encoding="gbk")
df.head()
df.describe()
#lat和long数据存在问题
df=df.loc[(df['Lat']>35)&(df['Long']<-55)]
#查看每列空值数量
df.isnull().sum()
#查看数据信息
df.info()
#将字符型转换为数值型
df['REPORTING_AREA']=pd.to_numeric(df['REPORTING_AREA'],errors='coerce')
#不重复分类计数
for i in df.columns:
print(i,len(df[i].unique()))
#每一特征类别
columns=['