对linear classifier 的整体理解

本文探讨了线性分类器在文本分类中的应用,介绍了Widrow-Hoff算法和Exponentiated Gradient (EG)算法。Widrow-Hoff算法是一个在线学习算法,通过梯度下降更新权重;而EG算法在处理高维数据时表现更优。线性分类器通过设置阈值实现二分类,并比较了在线学习与批量学习两种方式的优缺点。
摘要由CSDN通过智能技术生成


文本分类将document抽取词汇形成特征向量x. 


d表示维度,xj 表示关键词与这篇文档的关联程度(一般使用tf-idf)


线性分类器对于文档的评分的一般形式为:


不同线性分类器的算法不同点都在于如何产生w。


比如


1 The Widrow-Hoff Algorithm

是一个online algorithm.

w 的计算方法是:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值