![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
Mr.姚先森
软件初学者
展开
-
wikiextractor 提取维基百科语料报错的解决办法
我提取维基百科语料的时候,刚开始使用的wikiextractor ,后来发现总是报错,于是就没有用了,由于很多人都在问我是怎么提取的,现在把代码公布下。原创 2022-08-20 21:19:04 · 1014 阅读 · 7 评论 -
关于sklearn中的pipeline和GridSearchCV相结合寻找最优参数的方法
所谓pipeline,就是由一系列数据转换步骤或待拟合模型(如果有,则模型必须处于管道末端)构成的加工链条,最大的作用就是将两个模型串联起来。在本次实验中,我需要使用评论进行情感分析,但是svm没办法直接接收文本数据,所以我首先使用pipeline将TFIDF和SVM进行串联,如图所示:串联好了以后,我需要使用GridSearchCV找到最优参数, 刚开始的时候,我直接使用字典设置相关参数,如图: 没想到直接抛出了异常:key错误 很明显,直接设置参数模型并不知道这个参数属于哪一个模型,于是通过查阅官方文档原创 2022-07-10 11:43:52 · 550 阅读 · 0 评论