python数据分析-北京市新房市场价格波动分析

一、研究背景

随着北京市经济的快速发展和城市化进程的加速,房地产市场一直是人们关注的焦点。新房价格的波动不仅影响着购房者的决策,也对整个房地产市场的稳定和发展产生重要影响。因此,对北京市新房价格的波动进行分析具有重要的现实意义。

二、实证分析

首先导入基本的数据分析包

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

读取数据集并且查看数据前五行

数据和代码

接下来对数据进行描述性统计分析

数据集包含12个观察值。这表明数据涵盖了一年的时间(月度数据)。均值:平均房价为69964.17。这是数据集中房价的平均值,反映了总体水平。标准:标准差为2390.04。这表明房价的波动性。较高的标准差表示房价在不同时间点之间波动较大。最小值:最低房价为65568。这是数据集中房价的最低值。第25百分位数(25%):第25百分位数为68397.75。这意味着有25%的数据点的房价低于68397.75,反映了房价分布的下四分位数。中位数(50%):中位数为70734.50。中位数是数据集的中间值,表示有一半的房价高于这个值,另一半低于这个值。第75百分位数(75%):第75百分位数为71778.50。这意味着有75%的数据点的房价低于71778.50,反映了房价分布的上四分位数。最大值(max):最高房价为72839。这是数据集中房价的最高值。房价数据的平均值为69964.17,表明在这段时间内,房价大约在这个水平。标准差为2390.04,显示房价有一定的波动性。最低房价为65568,最高房价为72839,说明房价在不同月份之间有明显的变化。从四分位数可以看出,房价的中间50%(即从第25百分位数到第75百分位数)集中在68397.75到71778.50之间。这个统计信息提供了对房价数据总体趋势和变异性的一些初步理解。

接下来进行可视化展示-北京市新房住宅市场价格波动

plt.rcParams['font.sans-serif'] = ['KaiTi']  #中文
plt.rcParams['axes.unicode_minus'] = False   #负号
plt.figure(figsize=(10, 6),dpi=250)
plt.plot(data['日期'], data['价格'], label='价格')
plt.xlabel('日期')
plt.ylabel('价格')
plt.title('北京市新房住宅市场价格波动')
plt.legend()
plt.grid(True)
plt.show()

从北京市新房住宅市场价格波动的图可以看出,房价仍然存在较大的波动。从2023年5月到2024年3月,房价经历了多次起伏,其中最显著的波动发生在2024年初。在2024年1月,房价达到了最高点,接近73000元每平方米。这一峰值标志着市场的短期高点,但这种高价并未持续很久。进入2024年之后,房价迅速下跌,并且从整体趋势上看,这种下跌的势头似乎还没有结束。这种价格波动可能受到多种因素的影响。例如,市场需求的变化、政府政策的调整、经济环境的波动等,都可能对房价产生显著影响。特别是在2024年初之后,房价的急剧下跌可能反映了市场对之前高房价的一种调整,也可能是由于政策收紧或购房需求减少所致。此外,从长期趋势来看,这种下跌可能表明市场正在经历一个调整期。尽管短期内房价有所回落,但长期的供需关系、经济发展和政策导向仍将继续影响市场的走向。对于购房者和投资者而言,理解这些波动背后的原因和趋势,有助于做出更明智的决策。

价格频数也可以看一下

plt.figure(figsize=(10, 6),dpi=250)
sns.histplot(data['价格'], bins=30, kde=True)
plt.title('价格分布情况')
plt.xlabel('价格')
plt.ylabel('频数')
plt.grid(True)
plt.show()

 

接下来进行线性回归模型分析,将日期转换为数值形式以进行回归分析

# 创建线性回归模型并进行训练
model = LinearRegression()
model.fit(X_train, y_train)

# 预测
y_pred = model.predict(X_test)

# 模型评价
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print(f'Mean Squared Error: {mse}')
print(f'R^2 Score: {r2}')

 

从图和具体结果可以看出,模型的均方误差为 2,066,176.35,这表明预测值与实际值之间存在较大的误差。MSE的值越小,模型的预测效果越好。因此,2,066,176.35 这个值是否可以接受,取决于你房价数据的范围和具体情况。如果房价数据的范围较大,这个误差可能是可以接受的;但如果房价范围较小,那么这个误差可能过大,模型需要进一步改进。

模型的 R² 值为 0.5869,这意味着模型能够解释大约 58.69% 的目标变量的变异。这是一个中等水平的结果,说明你的模型有一定的解释力,但还有改进的空间。

三、小结

本研究通过对北京市新房价格数据的分析,得出以下结论:

  1. 北京市新房价格在过去一年中经历了较大的波动,最高价格达到了 73000 元每平方米,最低价格为 65568 元每平方米。
  2. 从描述性统计分析可以看出,北京市新房价格的平均值为 69964.17 元每平方米,标准差为 2390.04 元每平方米,说明房价存在一定的波动性。
  3. 从可视化展示可以看出,北京市新房价格在 2024 年初达到了最高点,随后迅速下跌,并且从整体趋势上看,这种下跌的势头似乎还没有结束。
  4. 线性回归模型分析结果显示,模型的均方误差为 2,066,176.35,R² 值为 0.5869,说明模型的预测效果还有待提高。

综上所述,北京市新房价格在过去一年中经历了较大的波动,未来的走势仍存在不确定性。政府和相关部门应加强对房地产市场的监管,稳定房价,促进房地产市场的健康发展。同时,购房者和投资者也应密切关注市场动态,做出明智的决策。

创作不易,希望大家多点赞关注评论!!!(类似代码或报告定制可以私信)

 

 

  • 22
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值