机器学习入门项目分享 - 波士顿房价预测

这篇博客介绍了一个从Udacity机器学习课程中的入门项目——波士顿房价预测。通过分析数据集,理解特征如RM、LSTAT、PTRATIO与房价的关系,以及运用决策树模型进行预测。博客中详细阐述了数据导入、分析、模型训练和评估的步骤,强调了业务理解和特征工程的重要性。
摘要由CSDN通过智能技术生成

  机器学习入门项目分享 - 波士顿房价预测
  
  该分享源于Udacity机器学习进阶中的一个mini作业项目,用于入门非常合适,刨除了繁琐的部分,保留了最关键、基本的步骤,能够对机器学习基本流程有一个最清晰的认识;
  
  项目描述
  
  利用马萨诸塞州波士顿郊区的房屋信息数据训练和测试一个模型,并对模型的性能和预测能力进行测试;
  
  项目分析
  
  数据集字段解释:
  
  RM: 住宅平均房间数量;
  
  LSTAT: 区域中被认为是低收入阶层的比率;
  
  PTRATIO: 镇上学生与教师数量比例;
  
  MEDV: 房屋的中值价格(目标特征,即我们要预测的值);
  
  其实现在回过头来看,前三个特征应该都是挖掘后的组合特征,比如RM,通常在原始数据中会分为多个特征:一楼房间、二楼房间、厨房、卧室个数、地下室房间等等,这里应该是为了教学简单化了;
  
  MEDV为我们要预测的值,属于回归问题,另外数据集不大(不到500个数据点),小数据集上的回归问题,现在的我初步考虑会用SVM,稍后让我们看看当时的选择;
  
  Show Time
  
  Step 1 导入数据
  
  注意点:
  
  如果数据在多个csv中(比如很多销售项目中,销售数据和店铺数据是分开两个csv的,类似数据库的两张表&#x

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值