Pipeline : 将一系列的类连成一条流水线,让数据在流水线上跑起来
导入:
from sklearn.pipeline import Pipeline
参数解释:
Pipeline(steps, memory = None, verbose = False)
-
steps:
设定工序并取名
形式: [(),()] 列表里面为元组, 分别为名字和工序 -
memory:
不清楚 默认None -
verbose:
显示流水线所消耗的时间, 默认False不显示
pipe的函数
- fit fit_transform, get_params, predict
- score set_params: 设计工序的参数值
- descionfunction: 分类问题中计算各个实例到类别所代表的超平面之间的距离
- predict_proba: 返回nsample*classes的矩阵,表示实例在每个类别的概率 predict_log_proba:
对上面概率进行对数化处理
参考链接: 链接1