介绍:
之前学习了xgb的通俗介绍,和从数学的角度深入看了一下xgb的数学原理 。其实一般情况下,你知道如何运用就可以了。人们常说 人和动物的最大区别是会使用工具,而不是说了解工具的原理。 所以你用好xgb是一个最基础工作,咱得会。
学习一个算法实战,一般按照以下几步,第一步能够构建一个模型,第二步是能够优化一个模型 。
本章,我们将学习以下内容如果使用xgboost构建分类器
xgboost 的参数含义,以及如何调参
xgboost 的如何做cv
xgboost的可视化
准备数据 :
我们使用boston 房价数据 ,做的是一个回归任务,分类任务类似。
导入包
from sklearn import datasets
import pandas as pd
import xgboost as xgb
import numpy as np
from sklearn.metrics import mean_squared_error
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
读入和展示数据
boston = datasets.load_boston()
data = pd.DataFrame(boston.data)
data.columns = boston.feature_names
data['price'] = boston.target<