K近邻房价评估--唐宇迪

该博客介绍了如何使用K近邻(KNN)算法来预测房价。作者选取了特定的房屋特征,如房间数量,计算了与目标房源的欧式距离,并基于KNN求取最近邻的平均价格。通过将数据集划分为训练集和测试集,评估了模型的预测性能,发现不同特征对预测结果的影响差异显著。
摘要由CSDN通过智能技术生成
k近邻房价预测
[python] view plain copy
  1. import pandas as pd  
  2. features=['accommodates','bedroom','bathroom','beds','price','minimum_nights','number_of_reviews']#样本特征,只取全部特征的这些列  
  3. dc_listings=pd.read_csv('listings.csv')#读取数据  
  4. dc_listings=dc_listings[features]#只取这8个特征的数据  
  5. print(dc_listings.shape)#输出(3723,8)  拿到3723条数据,每个数据有8个特征值  

如果有1个房间的房子,能租多少钱?首先,得看看别人都租了多少钱。(看1个房间别人都租了多少钱)


k表示我们的候选对象的个数。也就是和我房间数量最相近的其他房子。

(找3个房间为3的K=3,找5个房间等于3的k=5,以此类推...)

假设数据源中有5个信息,现在我想针对我的房子(只有一个房间)来定一个价格。


现在选K=3,也就是选择3个跟我最近的房源。可以考虑求下平均值。


距离的定义:

如何才能知道哪些数据样本和我最接近呢?采用欧式距离。


q1-qn为一条数据的所有特征信息,p1-pn为一条数据中的所有特征信息。

假设我们的房子有3个房间。

[python] view plain
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值