运用公开住宅出租挂牌数据进行住宅租金预测

租金预测案例学习:

数据来源:
上海在租房源信息

时间节点:2019年7月17日

数据集包括在线租房源信息及其基本情况

属性信息:楼盘名称;租赁方式;面积;朝向;房租;城市;区域;街道或片区;地址;公交站等

学习目标:
1)探索查看真实房源数据,找一找数据存在哪些问题?
要求:

① 读取一个真实房源的数据表

② 查看已有的数据存在哪些问题,确认数据应该如何清洗

2)针对数据存在的问题,应该采取怎么样的数据清洗策略?
要求:

① 根据上一节发现的数据问题,编写数据清洗函数,并测试清洗函数

② 使用数据清洗函数对所有真实房源数据表进行处理并合并

③ 输出清洗合并后的数据表

3)如何根据房源地理位置信息关联更多空间特征来提高租金模型的泛化能力?
要求:

① 利用已有的数据获取有效的样本地址信息

② 根据地址信息关联更多的空间特征

③ 输出关联了地理特征的完整模型数据表

4)如何进行模型数据预处理?
要求:

① 以平米租金(单位:元/月/每平米)为应变量

② 处理模型数据中存在的缺失值、异常值问题

③ 输出最终的建模数据表

5)选取不同的模型进行模型训练并对比模型效果、优化模型效果,确定最终预测模型
要求:

① 使用留一法进行数据集划分,验证集比例:30%

② 训练至少两个不同类型的模型进行租金模型训练,并对比模型效果

③ 优化模型效果,确定最佳模型,并保存模型文件

建议工作流程:
1. 数据探索
2. 数据清洗
3. 特征补充
4. 数据预处理
5. 训练并优化模型

6. 模型保存

原始数据链接: https://pan.baidu.com/s/1bgakkH6Gq6sq2Ahuyirjqg
代码链接: 租金预测.ipynb
脑图链接: 建模工作流程 租金预测案例.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值