- 博客(2)
- 资源 (10)
- 收藏
- 关注
原创 TF-IDF词汇加权
1. TF-IDF定义:tf-idf, term frequency - inverse document frequency,词频 -逆向文档频率。用于评价一个单词在整个语料库中的重要程度, 即这个词是否对不同文档有着很好的区分能力.如果某个词语term在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为这个词语具有很好的文档分类能力。它通常用于词加权, 即作为权重因...
2019-03-22 16:49:48 753
原创 SVM的基本推导
1、SVM的作用对于给定的训练样本集D={(x1,y1), (x2,y2),… (xn,yn)},yi属于{-1,+1},希望能找出一个超平面,把不同类别的数据集分开,对于线性可分的数据集来说,这样的超平面有无穷多个,而最优的超平面即是分隔间距最大的中间那个超平面2、硬间隔最大化对于以上的KKT条件可以看出,对于任意的训练样本总有ai=0或者yif(xi) - 1=0即yi...
2019-03-14 00:02:45 2618 1
hog_svm_train_python
2018-04-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人