机器学习实战 - Chapter 2 - End To End - Code Annotation

The instance

Based on the longitude and latitude, inhabitants, median incomes etc, to predict the house value.

1. Download the data and unzip

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2. Load and Preparation

Each row represents one district. There are 10 attributes.

在这里插入图片描述

total_bedrooms has null values
ocean_proximity 's type is object

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3. Custom random sampling

在这里插入图片描述

4. Stratified Sampling

在这里插入图片描述

5. Compare of the proportions in stratified sampling

It looks like the same

在这里插入图片描述

6. Compare of the proportions in stratified and random sampling

random

在这里插入图片描述
在这里插入图片描述
Delete income_cat attribute
在这里插入图片描述

7. Save train set and test set

在这里插入图片描述

8. Load Data, Name train set to housing

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

9. Looking for correlations

Colormap the median house value of California
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

10. Data Processing

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

11. Tips: Pipeline introduction

在这里插入图片描述
在这里插入图片描述

12. Sklearn data processing

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

13. Model Selection and validation

在这里插入图片描述
在这里插入图片描述

The better performance as below

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Based on grid search, we can find the best Super-parameter of the Randomtree algorithms

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

14.Validate the system with test dataset

在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值