机器学习-CatBoost如何处理非数值型(Object)数据
很多机器学习模型在使用数据训练模型时,都无法处理非数值型数据,这就需要我们提前将数据进行独热编码,然后再使用数据训练模型,不过我一直倾心于CatBoost模型,CatBoost模型有以下几个特征:
1.无需对非数值型数据进行预处理(!!!特别暖心)
2.不需要调参,采用默认的参数就能训练出很好的模型
3.可以基于GPU训练模型
4.可以减少过拟合(如果你的数据平衡性非常差,那就当我没说)
categorical_features_indices = np.where(data.dtypes != np.fl
原创
2022-04-21 17:39:19 ·
3331 阅读 ·
0 评论