SVM的个人理解

帮助到你了就点个赞吧!

Powered By Longer-站在巨人的肩膀上


网上有大把SVM的推导、原理、简介等等,但始终感觉不得要领。今天看到简书里面一篇SVM面试题,里面把一些对理解很重要,但是其他教程一般不写的内容用人话表达了出来。无论是自己理解,还是准备面试,都可以加深自己对SVM的理解。

下面文字是部分内容摘录,详情请移步简书:

https://www.jianshu.com/p/fa02098bc220

SVM的面试题目相对有章可循,本次记录一下常见的几个面试题

一句话介绍SVM

SVM是一种二分类模型,他的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔大使它有别于普通的感知机,通过核技巧隐式的在输入空间直接求解映射空间中特征向量的内积,使其成为一个非线性分类器。SVM的学习策略是间隔最大化,可形式化为一个求解凸二次规划问题。

SVM中的几个核心概念

1 确定超平面及函数间隔

由空间上的平面公式确定超平面 wx+b = 0,且 |wx+b| 表示点 x 到平面上的距离。正类负例位于分割平面两侧,因此y(wx+b) 可同时表示分类正确性以及距离确信度。这也就是函数间隔,其被定义为训练集中所有点到超平面距离的最小值。

2 几何间隔

由于成比例地缩放w和b会使得 |wx+b| 跟着成比例缩放,因此,需要对法向量w加上约束,使得间隔是确定的,也就是函数间隔整体除以 ||w||,也就得到了几何间隔

3 间隔最大化(硬间隔)

分为硬间隔最大和软间隔最大
SVM的基本思想就是求解可以正确划分数据集并且几何间隔最大的分离超平面,其原因是线性可分超平面有无数个,但是间隔最大超平面是唯一的。

间隔最大化的意思就是以充分大的确信度对训练数据进行分类,也就是说,不仅将正负实例分开,同时对最难分的实例点(距离超平面最近的点)也有足够大的确信度将其分离。
此处推出约束优化问题的原始形式(见上一篇博客)

4 支持向量

与超平面最近的点被称为支持向量,也就是使得原始问题约束项成立的点。
实际上离超平面很远的点已经被正确分类,我们让它离超平面更远并没有意义。反而我们最关心是那些离超平面很近的点,这些点很容易被误分类。如果我们可以让离超平面比较近的点尽可能的远离超平面,那么我们的分类效果会好有一些

5 核函数

注意,核函数本质不是将特征映射到高维空间,而是找到一种直接在低位空间对高维空间中向量做点积运算的简便方法。
其证明以及案例可参考李航-统计学习方法 P117

6 为何将原始问题转为对偶问题

总是说对偶问题更容易求解,道理在哪呢?

之所以说换为对偶问题更容易求解,其原因在于降低了算法的计算复杂度。在原问题下,算法的复杂度与样本维度相关,即等于权重w的维度,而在对偶问题下,算法复杂度与样本数量有关,即为拉格朗日算子的个数。
因此,如果你是做线性分类,且样本维度低于样本数量的话,在原问题下求解就好了,Liblinear之类的线性SVM默认都是这样做的;但如果你是做非线性分类,那就会涉及到升维(比如使用高斯核做核函数,其实是将样本升到无穷维),升维后的样本维度往往会远大于样本数量,此时显然在对偶问题下求解会更好。

另一方面,我们有分析过,只有在支持向量上的样本对应的拉格朗日算子λ才大于0,其余的λ都是=0,而转为对偶问题的计算对象仅有λ,所以大大降低了计算复杂度。



作者:0过把火0
链接:https://www.jianshu.com/p/fa02098bc220
来源:简书


帮助到你了就点个赞吧!

Powered By Longer-站在巨人的肩膀上

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: SVM支持向量机)情感分析是基于机器学习算法的一种文本情感分析方法。在毕业设计中,我们可以利用SVM算法对一定范围内的文本进行情感的分类和预测,以此对社会事件、社交网络、新闻评论等文本进行主观性的分析和判断。 基于SVM的情感分析算法需要进行以下步骤: 1. 数据预处理:收集、清洗、筛选原始数据,并对数据进行分词、去除停用词等处理。 2. 特征提取:通过对已经处理过的数据进行特征提取,将文本转化为数字向量,为后续分类和预测做准备。通常采用的特征提取方式有TF-IDF和词袋模型等。 3. 情感分类:利用SVM分类器对文本数据进行分类和预测,将文本情感分为正面、负面和中性三种,以此来判断文本的情感倾向。 4. 模型优化:根据数据的实际情况和分类效果,优化模型和调整参数,以提高模型的准确率和效果。 SVM情感分析算法逐渐成为了文本情感分析的主流算法,在社交网络、新闻评论、在线客服等领域有着广泛的应用前景。毕业设计中,实现SVM情感分析算法可以锻炼学生的机器学习和文本处理能力,同时培养学生的创新能力和实践能力。 ### 回答2: SVM情感分析是一种能够识别文本情感的机器学习技术,其思路是将文本转化为特征向量并通过训练集确定感情极性,最后进行预测和分类。毕业设计SVM情感分析是指通过设计和实现一套完整的SVM情感分析系统,来分析文本对应的情感极性,帮助人们更好地理解和识别信息的感情倾向。 该设计思路包括以下几个关键步骤:首先,通过收集和整理大量的语料库,确定情感分类标签和特征基准,划分训练集和测试集。其次,通过特征选择和提取技术,将文本转化为特征向量,从而实现量化及可视化处理。再次,通过SVM算法进行学习与训练,建立模型并进行调优。最后,应用模型对新文本进行情感极性分类,评估和比较算法的预测效果。 在毕业设计中,需要掌握机器学习和自然语言处理的相关技术,如特征提取和转化、算法调优等,同时也需要掌握JAVA、Python等编程语言,以及相关工具和框架的使用。同时要注意的是,对于不同类型的语言和语音特点,需要采用不同的处理方式和算法,并做好相关的性能测试和评估。 总之,毕业设计SVM情感分析有着广泛的应用和研究价值,可以应用于互联网舆情分析、市场调查、情感分析等多个领域,帮助企业和个人更好地理解文本信息的情感倾向和态度,提高决策的准确性和速度。 ### 回答3: SVM情感分析是一种基于机器学习的情感分类算法。该算法通过对训练语料库进行学习,得到一个能够将文本分为正面、负面和中性情感的分类器。在实际应用中,SVM情感分析技术可以用于电商评论、社交媒体内容以及新闻报道等文本数据的情感分类,以帮助人们更好地了解公众对于产品、事件和社会问题的态度和看法。 如果想要开展毕业设计SVM情感分析,可以按照以下步骤进行: 一、确定研究问题:毕业设计的第一步是确定研究问题,了解所选题目的背景、研究现状和应用场景。 二、数据采集和预处理:SVM情感分析需要使用大量的文本数据,因此可以通过网络爬虫等方式进行数据采集,并对数据进行初步的清洗和预处理,例如去除标点符号、停用词和数字等。 三、特征提取:SVM情感分析需要将文本转换为向量形式,所以需要进行特征提取。特征提取一般包括词袋模型、TF-IDF等。 四、训练SVM模型:将SVM算法与数据集结合起来进行训练。SVM算法训练过程一般包括参数调整、模型选择和性能评估等步骤。 五、测试模型及结果分析:在测试阶段,使用测试集对模型进行测试,并对模型的性能进行评估。根据测试结果可以对模型进行优化和改进。 六、毕业设计论文撰写:在毕业论文撰写过程中,对于SVM情感分析算法的原理、技术细节、实验结果和应用场景进行叙述和分析。 毕业设计SVM情感分析是一项有挑战性的研究项目,需要具备一定的编程、数学和文献查找等能力。通过对该项目的研究和实践,能够全面掌握机器学习技术和情感分析应用方法,为今后从事相关领域的工作打下坚实的基础。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值