所谓pipeline,就是由一系列数据转换步骤或待拟合模型(如果有,则模型必须处于管道末端)构成的加工链条,最大的作用就是将两个模型串联起来。
在本次实验中,我需要使用评论进行情感分析,但是svm没办法直接接收文本数据,所以我首先使用pipeline将TFIDF和SVM进行串联,如图所示:
串联好了以后,我需要使用GridSearchCV找到最优参数, 刚开始的时候,我直接使用字典设置相关参数,如图:
没想到直接抛出了异常:key错误
很明显,直接设置参数模型并不知道这个参数属于哪一个模型,于是通过查阅官方文档发现了如下代码
可以看出来,同样是两个模型串联,同