其他相关文章
DS&ML_关联分析笔记
DS&ML_分类算法笔记之随机森林、梯度提升树、XGBoost模型
DS&ML_分类算法笔记之k-近邻、KD-Tree模型
DS&ML_降维算法笔记之主成分分析PCA模型
DS&ML_分类算法笔记之朴素贝叶斯模型
DS&ML_聚类算法笔记之k-means模型
DS&ML_分类算法笔记之决策树模型
DS&ML_分类算法笔记之逻辑回归模型
对于支持自动机SVM模型的相关知识点的总结与整理
简单描述一下支持自动机的思想,SVM是什么?
思想:支持向量机把分类问题转化为寻找分类平面的问题,并通过最大化分类边界点距离分类平面的距离来实现分类。(Copyright © https://blog.csdn.net/s_gy_zetrov. All Rights Reserved)
核函数
在将低维空间映射到高维空间的时候,SVM引入了核函数,目的是实现数据的线性可分。常见的核函数有线性内核,多项式内核,径向基内核(RBF高斯核函数),sigmoid核。
以下有关核函数内容来自台湾大学libSVM团队的guide
- RBF核函数可以将一个样本映射到无限维的空间,而且线性核函数是RBF的一个特例,也就是说如果考虑使用RBF,那么就没有必要考虑线性核函数了。
- 与多项式核函数相比,RBF需要确定的参数要少,核函数参数的多少直接影响函数的复杂程度。另外,当多项式的阶数比较高时,核矩阵的元素值将趋于无穷大或无穷小,而RBF则在上,会减少数值的计算困难。
- 对于某些参数,RBF和sigmoid具有相似的性能。
- RBF kernel更方便计算,取值在[0,1];而用polynomial kernel取值范围是(0,inf),在自由度高的情况下更凸显出劣势;至于sigmoid,它可能在某些参数下是无效的
- 为什么RBF可以映射到无限维?
- 径向基就是把每个数据看作是一个基准然后分别计算所有数据与这个基准之间的高斯函数。如果原始数据维度是2,有n条数据,就成功把一个2维向量升到了n维。
- 高斯核函数能把数据升到无穷维。比如原始空间为k维,有n条数据,那我已经由k维升到了n维,这时再加一条新的与原始数据不重合的样本,那就能映射到n+1维了,依次循环往复。
- 为什么RBF可以映射到无限维?
优点
- 可以解决小样本下机器学习的问题。
- 提高泛化性能。
- 文本分类、文字识别、图像分类等方面仍受欢迎。
- 避免神经网络结构选择和局部极小的问题。
缺点
- 不太适合大规模数据集的训练
- 对缺失值敏感
- 内存消耗大,而且难以解释,不像决策树,很好解释
用SVM的什么核函数还是直接用逻辑回归:by吴恩达
- 如果Feature的数量很大,跟样本数量差不多(或远大于样本数量),这时候选用逻辑回归或者是Linear Kernel的SVM
- 如果Feature的数量比较小,样本数量一般,不算大也不算小(或相对较多),选用SVM+Gaussian Kernel
- 如果Feature的数量比较小,而样本数量很多,需要手工添加一些feature变成第一种情况
零碎的一些知识点积累
R语言e1071包:svm函数,支持向量机算法;kernlab包:ksvm函数,基于核函数的支持向量机
(Copyright © https://blog.csdn.net/s_gy_zetrov. All Rights Reserved)
visitor tracker