数据特征分析之分布分析
利用python做数据分析,数据特征分析之分布分析,个人学习笔记,欢迎指正
(1)导入数据分析包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
% matplotlib inline
(2)数据读取,利用散点图显示
# 数据读取
data = pd.read_csv('C:/Users/Hjx/Desktop/深圳罗湖二手房信息.csv',engine = 'python')
plt.scatter(data['经度'],data['纬度'], # 按照经纬度显示
s = data['房屋单价']/500, # 按照单价显示大小
c = data['参考总价'], # 按照总价显示颜色
alpha = 0.4, cmap = 'Reds')
plt.grid()
print(data.dtypes)
print('-------\n数据长度为%i条' % len(data))
data.head()
# 通过数据可见,一共8个字段
# 定量字段:房屋单价,参考首付,参考总价,*经度,*纬度,*房屋编码
# 定性字段:小区,朝向
(3)计算极差,这里运用了函数
# 极差:max-min
def d_range(df,*cols):
krange = []
for col in col