XGBOOST处理的数据形式,主要可以是libsvm, 三元组,numpy的形式
其中,numpy的形式是最常见的,通常情况下,使用HIVE处理的数据,样本字段,往往都是处理成numpy的形式,进行处理。
但是,当数据非常稀疏的时候。可以将数据处理成KEY:VALUE的形式或者四三元组的形式
尤其是点击对应的推荐系统
XGBOOST处理的数据形式,主要可以是libsvm, 三元组,numpy的形式
其中,numpy的形式是最常见的,通常情况下,使用HIVE处理的数据,样本字段,往往都是处理成numpy的形式,进行处理。
但是,当数据非常稀疏的时候。可以将数据处理成KEY:VALUE的形式或者四三元组的形式
尤其是点击对应的推荐系统