2019上半年深圳二手楼市热度如何?(链家数据爬取&分析)

2019上半年深圳二手楼市热度如何?(链家数据爬取&分析)

1.多进程爬取2w+链家网深圳已成交二手房数据

具体步骤省略(阅读时可跳过此处,具体内容及代码欢迎查阅&fork:https://www.kesci.com/home/project/5d5e4ca78499bc002c05b75e

  1. 注意代码应记录或提示爬取出错的相关信息,以便查询。
  2. 注意异常处理,以免程序假死或失败。

2.数据清洗与初探

2.1、数据清洗

具体步骤省略(阅读时可跳过此处,具体内容及代码欢迎查阅&fork:https://www.kesci.com/home/project/5d5e4ca78499bc002c05b75e

  1. 去除无用字段、提取字段信息、字段数值化等等后,数据集的基本信息如下:
    在这里插入图片描述
  2. 在部分数值字段描述中发现异常:
    在这里插入图片描述
    可以发现建成年代最大值存在异常,竟然有二手楼盘是2058年建成!
    于是先找到建成年代大于等于2020年的楼盘,如下:
    在这里插入图片描述
    直接查询同名楼盘建成年代众数来填补错误,并检查。

2.2、数据初探

  1. 数据整体房源分布、成交单价初探:在这里插入图片描述
  2. 用powermap可视化二手房源位置及区域平均单价:
    显然近香港的罗湖区、福田区、南山区成交楼盘最为密集,价格也最高。
    在这里插入图片描述
  3. 查看整体数据中,挂牌和成交时间分布直方图:
    可以发现2015上半年及之前基本没有挂牌信息,爬取的数据主要集中在2018及2019年。
    我们会简单对比2019和2018上半年情况,并着重分析2019h1的房源情况。
    在这里插入图片描述

3.分析深圳2019上半年二手楼市:

3.1、2019上半年深圳二手房成交情况总览:

  1. 2019上半年部分数值字段描述:
    2019上半年共成交8802套二手房,平均成交价390.658259,平均成交单价5.512047,平均成交周期126.419791,平均建筑面积70.323028。
    在这里插入图片描述
  2. 2019h1深圳二手房成交量日历图:
    用pyechart作成交量日历图,观察到三、四月成交较多,且周日、周一比较火热。
    在这里插入图片描述
    3.各区成交单价箱型图:
    成交单价方面南山区首屈一指,而宝安区已超过了中心区域的罗湖区。
    在这里插入图片描述

3.2、对比2018/2019上半年楼市,其热度有什么变化?

  1. 首先提取2018年上半年(1.1~6.30)成交数据,看一下部分字段描述:
    2018年上半年,共成交4813个楼盘,而2019h1成交数是8802,两者差别较大。
    2018年上半年 浏览、建成年代 略有缺失,套内面积 缺失严重,若需建模需考虑填补或舍去。
    在这里插入图片描述
  2. 通过powermap观察2018h1、2019h1二手房成交分布情况差异:
    由图可以发现2018上半年缺失龙岗区的成交记录,验证数据后发现确实如此(略)。
    所以在和2018h1对比时,2019h1应剔除龙岗区的成交记录。单独讨论2019h1时则使用其全部数据。
    在这里插入图片描述
  3. 提取2019年上半年(1.1~6.30)成交数据(除龙岗区),看一下整体描述:
    2019年上半年(除龙岗区),共成交6813个楼盘。
    浏览、建成年代略有缺失,套内面积缺失严重,若需建模需考虑填补或舍去。
    在这里插入图片描述
  4. 对比2018h1和2019h1(除龙岗区):
    图1. 楼盘成交周期分布更加平缓,19上半年卖出的房源,挂牌时间往往更久。
    图2. 成交楼盘中户型成交倾向由原来70-80平,改为80-90平,意味着成交价格更高。
    图3. 成交价、单价等价格相关均有不同程度上涨。
    另外,带看量 和 浏览数 明显增加,可能体现了热度的增长,但主要和网站用户量和数据收集情况有关,仅可参考。
    在这里插入图片描述
    简评:
    虽然19年上半年房价高企,但大家却倾向于买更大建筑面积楼盘,可见资金仍然比较充足,土豪或加杠杆的人数仍比较多。
    另外楼盘平均成交周期增长,可能体现了买家相较过去更为谨慎。
    目前来看,2019上半年深圳楼市"似乎"还是相当火热!

3.3、对比2018/2019上半年楼市,加价/减价成交情况有何变化?

  1. 2019上半年(除龙岗区)成交二手房加减价比例:
    从图中了解到加价成交占总体成交5.02%,减价成交占87.42%
    在这里插入图片描述
  2. 2018上半年成交二手房加减价比例:
    我们再参考一下2018h1的情况,发现18年上半年减价成交占比更少,加价成交占比更多。
    在这里插入图片描述
  3. 2018h1/2019h1(除龙岗区)成交加减价情况:
    由图可知,2019h1(除龙岗区)加价成交幅度略增,减价成交的幅度增加明显。
    另外,2019h1(除龙岗区)的楼盘成交平均要降价15.78万。
    在这里插入图片描述
  4. 2019h1各区成交平均降价幅度:
    其中南山区、宝安区、龙华区这三个成交量居中的区域,平均降价幅度最大。
    另外我们再观察各区域降价情况,南山区这样比较不错的地段,平均降价30万+才能成交。
    无论如何,在出价策略长期不变的情况下,可见出价者和求购者的认知存在偏差。
    在这里插入图片描述

3.4、2019上半年哪类房子比较好卖?(成交数量多)

ps:为缩减篇幅只分析一部分较有价值的属性。

  1. 2019h1、2018h1建筑面积kde图:
    由图可知40平左右小户型和80平左右中户型比较好卖。
    在这里插入图片描述
  2. 房屋朝向成交量、成交价、成交单价关系图:
    朝向南或北的房子好卖,但同时朝南北却卖得不是很多。
    由图或查看数据可知:虽然南北朝向平均单价不高,但可能面积较大,成交总价较高,令人生畏。
    在这里插入图片描述
  3. 户型、装修成交情况:
    成交数前5的户型中,前三名是"2室1厅1厨1卫",“1室1厅1厨1卫”,“2室2厅1厨1卫”。看来还是主流户型(性价比高)比较好卖呀!
    精装房最受欢迎。毛坯成交量最少,查阅数据可知其平均单价倒数第二,但平均总价却最高。
    在这里插入图片描述
  4. 区域成交量:
    罗湖区、龙岗区二手房最好卖。
    在这里插入图片描述
  5. 楼层数分布及楼层位置成交情况:
    楼盘总层数为7层或32层左右比较好卖
    房屋在中层比较好卖,高层太吓人,底层阳光少,视野窄。
    在这里插入图片描述
  6. 是否配电梯及梯户比例成交情况:
    这年头都是高楼大厦,没电梯简直难于上青天。其中一梯四户,一梯两户,两梯四户比较好卖。
    在这里插入图片描述
  7. 建成年代成交量分布图:
    2000~2008左右建成的房子成交量较多
    在这里插入图片描述

3.5、其他

  1. WordCloud-楼盘热度:
    哪些是热门楼盘?
    在这里插入图片描述
  2. 下图是部分字段的相关系数热力图,我们会发现:
    (1)成交周期和调价存在弱相关性。
    (2)关注数和带看次数有一定相关性,但关注数和带看次数并没有和成交周期形成负相关。
    (3)浏览数和关注数没有多大关系,所以这方面数据仅供参考。
    (4)有趣的是,浏览数最高达到532127的楼盘,成交周期还是要112天,估计是业主做了推广,但仍没有很快成交。
    在这里插入图片描述
  3. tableau仪表盘:
    https://public.tableau.com/views/2019_15670928250750/1?:embed=y&:display_count=yes&:origin=viz_share_link
    在这里插入图片描述

4.总结

  1. 通过上面的分析,我们了解到深圳2019h1的二手楼市,同比2018h1,2019h1的房价依然稳中有进,较为火热,但平均成交周期更长,减价成交比例增加,买卖方认知差异拉大,买方更加谨慎。
  2. 所以如果想卖得更快,早点变现,可以先考察一下自己房子属性如何,如果优势不大则适当减价吧。
  3. 想起今年的一句流行言论:“2019可能是过去10年最差的一年,但也是未来10年最好的一年。”面对可能出现变局的房地产市场,我们能做的就是持续关注,做好功课,免得决策失误,拍断大腿!

欢迎查阅本篇代码完整版:https://www.kesci.com/home/project/5d5e4ca78499bc002c05b75e
博文地址:https://blog.csdn.net/richand112233/article/details/100109296

  • 3
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
北京链家二手房数据分析的伪代码可以概括为以下几个步骤,这里以Python为例: ```python # 导入所需库 import pandas as pd from bs4 import BeautifulSoup import requests from selenium import webdriver # 定义函数:获网页数据 def fetch_data(url): # 使用Selenium模拟浏览器行为(如果网站有反虫机制) if use_selenium: driver = webdriver.Chrome() # 使用Chrome浏览器 driver.get(url) html = driver.page_source driver.quit() else: response = requests.get(url) html = response.text # 使用BeautifulSoup解析HTML soup = BeautifulSoup(html, 'html.parser') # 提数据 data = extract_data_from_soup(soup) return data # 定义函数:数据清洗和预处理 def clean_data(data): # 处理缺失值、异常值,标准化格式 cleaned_data = preprocess_data(data) # 数据转换(如日期格式化、数值类型转换等) transformed_data = convert_data_types(cleaned_data) return transformed_data # 定义函数:数据分析 def analyze_data(data): # 计算基本统计量(如平均价、销量等) summary_stats = calculate_summary_stats(data) # 数据可视化(如房价分布图、成交量趋势图) visualize_data(data, summary_stats) # 进行更深入的分析(如价格-面积相关性、区域热度分析等) advanced_analysis = perform_advanced_analysis(data) return advanced_analysis # 主程序入口 url = "https://bj.lianjia.com/ershoufang/" # 链家北京二手房主页 raw_data = fetch_data(url) processed_data = clean_data(raw_data) analysis_results = analyze_data(processed_data) # 输出分析结果 print(analysis_results) #

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值