【PythonPlanet】二手房产成交数据分析

一、项目概况

该项目是使用Python对北京二手房经纪人成交数据进行分析的一个综合实例,包括pandas/numpy/matplotlib绘图的应用,涉及到数据读取、清洗、离散化等处理,使用了分组分析、假设验证分析和相关性分析等分析方法。

分析目标:

  1. 分析北京二手房成交价格分布
  2. 分析成交量超过一亿的经纪人及其相关因素
  3. 寻找每个经纪人成交总价最高的5条记录

二、数据概况

数据涵盖2011年-2016之间,北京二手房经纪人的成交数据,共约16万2千条成交记录,包括比较全面的信息。
数据字段如下图:
图片

三、数据读取与合并

3.1 数据读取

如下图,数据源包括7个csv文件。
在这里插入图片描述
为了读取上述7个文件,我们可以使用循环读取数据,读取的方法是read_csv。同时,因为数据编码方式不同,所以要设定读取的编码方式。读取结果如下图,我们获得了7个list。
在这里插入图片描述

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
data_list = []
for i in range(1,8):
    try:
        data = pd.read_csv('./fangchan/lianjia{}.csv'.format(i),encoding = 'utf-8')  # encoding默认是utf-8,可省略
    except:
        data = pd.read_csv('./fangchan/lianjia{}.csv'.format(i),encoding = '
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值