1. 数据接口
LightGBM Python模块使用以下几种方式来加载数据:
- libsvm/tsv/csv
- Numpy 2D array, pandas object
- LightGBM binary file
加载后的数据存在Dataset
对象中。
- 要加载ligsvm文本文件或LightGBM 二进制到 Dataset 中:
train = lgb.Dataset('train.svm.bin')
- 要加载 numpy 数据到 Dataset 中:
data = np.random.rand(500, 10) # 500行,1列
label = np.random.randint(2, size