How to train Boosted Trees models in TensorFlow
本教程是使用带有tf.estimator
API的决策树训练Gradient Boosting模型的端到端演练。 Boosted Trees模型是回归和分类中最受欢迎和最有效的机器学习方法之一。 这是一种集合技术,它结合了几种(认为10s,100s甚至1000s)树模型的预测。
Boosted Trees模型在许多机器学习实践中很受欢迎,因为它们可以通过最小的超参数调整实现令人印象深刻的性能。
加载titanic数据集
您将使用泰坦尼克数据集,其中(相当病态)的目标是预测乘客的生存,给出性别,年龄,等级等特征。
from __future__ import absolute_import, division, print_function, unicode_literals
from matplotlib import pyplot as plt