TPOT是一种automl框架,它利用搜索算法,根据所提供的指标,对给定数据进行交叉验证,自动搜索出效果最好的机器学习pipeline组合。
代码也是非常简洁明了。框架会自动将最佳pipeline的代码导出到指定目录。
from tpot import TPOTClassifier
# 定义
pipeline_optimizer = TPOTClassifier(generations=5, population_size=20, cv=5,
random_state=42, verbosity=2, scoring='accuracy')
# 训练
pipeline_optimizer.fit(data, label)
# 保存路径
pipeline_optimizer.export('your_path/your_file_name.py')