Pandas+Pyecharts | 北京某平台二手房数据分析+可视化

本文利用Pandas进行数据处理,Pyecharts进行可视化,深入分析北京市二手房的区域分布、平均价格、最贵房源、总价与面积关系、房屋朝向及楼层分布等,揭示二手房市场的特征和规律。
摘要由CSDN通过智能技术生成

用pandas进行数据处理,pyecharts对处理后的数据进行可视化分析市面上二手房各项基本特征及房源分布情况,探索二手房大数据背后的规律。
Pyecharts的使用参考文档
Pyecharts实例大全

1. 升级 pyecharts 包

地图显示部分需要用到 pyecharts==1.9.0

!pip install --upgrade pyecharts

2. 导入模块

import pandas as pd
from pyecharts.charts import Map
from pyecharts.charts import Bar
from pyecharts.charts import Line
from pyecharts.charts import Grid
from pyecharts.charts import Pie
from pyecharts.charts import Scatter
from pyecharts import options as opts

3. Pandas数据处理

3.1 读取数据

df = pd.read_csv("D:\浏览器下载文件\二手房数据.csv", encoding = 'gb18030')
df.head()

输出如下:
在这里插入图片描述

df.describe()

在这里插入图片描述

3.2数据查看缺失以及填充

查看是否有缺失值:

df.isnull().sum()

用“未知”填充:

df['电梯'].unique()
#output:array(['有电梯', '无电梯', nan], dtype=object)
df['电梯'].fillna('未知', inplace=True)

重复值处理:

df['朝向'].unique()
#output:array(['西', '南北', '东西', '南西', '西南', '东南', '南', '东北', '东', '西北', '北'],dtype=object)
df['朝向'] = df['朝向'].str.replace('南西','西南')

3.3 统计各城区二手房数量

以市区分组统计:

g = df.groupby('市区')
df_region = g.count()['小区']
region = df_region.index.tolist()
#output:region:['东城','丰台','大兴','密云','平谷','延庆','怀柔','房山','昌平','朝阳','海淀','石景山','西城','通州','门头沟','顺义']
count = df_region.values.tolist()

输出df_region
在这里插入图片描述

统计结论:丰台、朝阳、海淀、昌平在售的房源数量最多,高达12000多套,占了总量的1/2

4.Pyecharts可视化

4.1 北京市二手房各区分布(地图)

渲染代码如下:

new = [x + '区' for x in region]
m = (
    Map()
    .add('', [list(z) for z in zip</
  • 4
    点赞
  • 46
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值