![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
自然语言处理
dream_uping
今天也是努力的一天
展开
-
中文文本分类的一些理解
这个embedding_SougouNews.npz,和.pkl的作用如下所示!下图中的三段数值:嵌入向量,类别编号,句子长度;原创 2022-10-13 10:07:26 · 251 阅读 · 0 评论 -
文本多分类工作
测试集(test set):开发集中选出的最优的模型在测试集上进行评估。不会据此改变学习算法或参数。开发集(development set):调整参数、选择特征,以及对学习算法作出其它决定。训练集、开发集、测试集的划分比例为18W:1W:1W。训练集(training set):训练算法。原创 2022-09-20 09:19:30 · 420 阅读 · 0 评论