一、 文本分类
1. 判别分类器
(1) logestic回归
(2) knn分类
如要求正中间那个四方格属于哪个分类,则先要确定k的值,若设k=1,则归为距它最近的一个类。若k=4,如图圈中会看到玫红方格所占概率3/4,点方格为1/4,则归为玫红方格的类中.
(3) SVM
尽力使分开的两个类别有最大的间隔,这样才使得分类具有更高的可信度,而且对于未知的新样本才有很好的分类预测能力。
一、 文本分类
1. 判别分类器
(1) logestic回归
(2) knn分类
如要求正中间那个四方格属于哪个分类,则先要确定k的值,若设k=1,则归为距它最近的一个类。若k=4,如图圈中会看到玫红方格所占概率3/4,点方格为1/4,则归为玫红方格的类中.
(3) SVM
尽力使分开的两个类别有最大的间隔,这样才使得分类具有更高的可信度,而且对于未知的新样本才有很好的分类预测能力。