02-27成都二手房分析之分析

三、数据分析

分析目的

1、近半年成都二手房整体挂牌量及均价走势如何?
2、目前成都二手房价位、房源有什么特点?
3、成都各区县的挂牌情况,找出抛压最大的区域?

数据清洗

首先查看我爬取的数据,共计23个维度,有些可以进行维度细分,比如:所在楼层、抵押信息、建筑面积等。
在这里插入图片描述

在进行数据清洗清洗前使用pandas_profiling对爬取的数据进行快速的统计分析如下:

#代码
import pandas-profiling
pandas_profiling.ProfileReport(data)

在这里插入图片描述

从统计分析报告内容可以看出本次爬取数据共计48586行,23列,存在61重复行,重复占比0.1%,报告继续下拉可以看到每一列的统计详情。

缺失数据详情查看:

np.sum(data.isnull()) 

在这里插入图片描述

接下来进行数据清洗:

①去重重复行

data.drop_duplicates(keep='first',inpalce=True)

②删除有空值的行

data.dropna(axis=0,how='any',thresh=<
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值