《Hands-on ML with Scikit-Learn,Keras&TensorFlow》读书笔记-第二章

Chapter2 端到端机器学习实例

Select a performance measure

RMSE

回归任务的一个典型performance measure是Root Mean Square Error(RMSE,均方根误差)
在这里插入图片描述RMSE(X,h)是使用假设h在数据X上测得的均方根误差

MAE

Mean absolute error(MAE,平均绝对误差)
在这里插入图片描述

Get the data

使用pandas获取数据

import pandas as pd
#This function returns a pandas DataFrame object containing all the data
def load_housing_data(housing_path=HOUSING_PATH):
    csv_path = os.path.join(housing_path, "housing.csv")
    return pd.read_csv(csv_path)

快速浏览数据结构

housing = load_housing_data()
housing.head()

在这里插入图片描述
info()方法可以快速浏览数据的结构(行数,列数,每个属性的值的类型)

housing.info()

在这里插入图片描述
查看单个属性可能的取值范围和实例数value_counts()

housing["ocean_proximity"].value_counts()

在这里插入图片描述
查看数据全貌 describe()

housing.describe()

在这里插入图片描述

创建一个测试集

scikit-learn提供了一些方法来得到训练集和测试集,

from sklearn.model_selection import train_test_split

train_set, test_set = train_test_split(housing, test_size=0.2, random_state=42)
test_set.head()

在这里插入图片描述

探索/可视化数据

为机器学习算法准备数据

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值