数据特征分析之分布分析

本文介绍了数据分布分析的步骤,包括数据读取、极差计算、直方图绘制以及频率分布的统计。通过Python函数计算了首付和总价的极差,并针对定量和定性字段进行了频率分布分析,使用直方图和饼图展示结果。
摘要由CSDN通过智能技术生成

数据特征分析之分布分析


利用python做数据分析,数据特征分析之分布分析,个人学习笔记,欢迎指正
(1)导入数据分析包

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
% matplotlib inline

(2)数据读取,利用散点图显示

# 数据读取

data = pd.read_csv('C:/Users/Hjx/Desktop/深圳罗湖二手房信息.csv',engine = 'python')
plt.scatter(data['经度'],data['纬度'],  # 按照经纬度显示
            s = data['房屋单价']/500,  # 按照单价显示大小
            c = data['参考总价'],  # 按照总价显示颜色
            alpha = 0.4, cmap = 'Reds')  
plt.grid()
print(data.dtypes)
print('-------\n数据长度为%i条' % len(data))
data.head()
# 通过数据可见,一共8个字段
# 定量字段:房屋单价,参考首付,参考总价,*经度,*纬度,*房屋编码
# 定性字段:小区,朝向

在这里插入图片描述
(3)计算极差,这里运用了函数

# 极差:max-min

def d_range(df,*cols):
    krange = []
    for col in col
  • 2
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值