Rocchio算法的核心思路是给每一个文档的类别都做一个的标准向量(也称为原型向量),然后用待分类的文档的向量和这个标准向量对比一下余弦相似度,相似度越高越可能属于该分类,反之亦然。
参考资料:
[1] https://blog.csdn.net/lilong117194/article/details/78987941
Rocchio算法的核心思路是给每一个文档的类别都做一个的标准向量(也称为原型向量),然后用待分类的文档的向量和这个标准向量对比一下余弦相似度,相似度越高越可能属于该分类,反之亦然。
参考资料:
[1] https://blog.csdn.net/lilong117194/article/details/78987941