11-1 什么是SVM

* 支撑向量机 Support Vector Machine

可以解决分类问题
也可以解决回归问题


· 先回忆一下逻辑回归的思想:


逻辑回归会找到一个决策边界,在边界的两侧分为不同的分类


对于一些数据决策边界不唯一的问题,叫做不适定问题


· 逻辑回归算法是如何解决不适定问题的?

先定义了一个概率函数,即,根据这个概率函数进行建模,形成了一个损失函数,最小化这个损失函数,得到theta,然后 theta*Xb=0 为边界。这个theta的求法是由我们训练数据决定的。


· 支撑向量机解决的思路稍有不同


决策边界会非常好的将训练数据集分为两个部分,
但是这个决策边界的泛化能力不好。
因为如果再来一个样本,根据这个决策边界我们会认为它是蓝色类的,但是直观来看,新的样本点应该是红色类的,这样分类错误的原因是因为我们的决策边界离红色点太近了。


上述的决策边界的泛化能力比较好
因为离决策边界最近的3个点,我们让它离决策边界的距离尽可能远,即让决策边界离红色点尽可能远又离蓝色点尽可能远,同时它还能很好的区分红色和蓝色区域。


总结:
上述的决策边界不仅要很好的区分训练数据,同时考虑到未来,让它的泛化能力比较好,这就是SVM思想,对未来的泛化能力尽可能的好,并没有寄希望于数据的预处理,或者找到模型之后再对模型进行正则化,而是直接放在了算法的内部。这个思想的背后有数学的理论,可以严格证明出对于一个不适定问题,使用SVM找到的决策边界它的泛化能力是好的。SVM也是统计学习中一个非常重要的方法。


· 继续剖析SVM中的决策边界


上图中3个点离决策边界的距离一样
并且这3个点是所有点中离决策边界最近的3个点


离决策边界最近的数据点又定义出了2根直线,他们与SVM得到的决策边界平行,2根直线定义了一个区域,在两根直线之间将不再有任何的数据点,SVM的决策边界是这个区域中间的那根线。
SVM尝试寻找一个最有的决策边界
距离两个类别的最近的样本最远
上面的支撑向量定义了一个区域,最优的决策边界被这个区域所定义(中间那根线)
因此支撑向量是SVM算法中非常重要的元素
SVM要最大化margin:
线性可分问题(对于样本点来说存在一根直线,或者高维空间中存在一个超平面将这些点划分)—> Hard Margin SVM
真实情况下很多数据线性不可分 —> Soft Margin SVM


* 思路总结:

机器学习算法中,尤其是参数学习算法,一个固定的套路,把我们要解决问题的思想先转化成一个最优化问题,然后最优化目标函数。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1. ARIMA 2. SARIMA 3. VAR 4. Auto-ARIMA 5. Auto-SARIMA 6. LSTM 7. GRU 8. RNN 9. CNN 10. MLP 11. DNN 12. MLP-LSTM 13. MLP-GRU 14. MLP-RNN 15. MLP-CNN 16. LSTM-ARIMA 17. LSTM-MLP 18. LSTM-CNN 19. GRU-ARIMA 20. GRU-MLP 21. GRU-CNN 22. RNN-ARIMA 23. RNN-MLP 24. RNN-CNN 25. CNN-ARIMA 26. CNN-MLP 27. CNN-LSTM 28. CNN-GRU 29. ARIMA-SVM 30. SARIMA-SVM 31. VAR-SVM 32. Auto-ARIMA-SVM 33. Auto-SARIMA-SVM 34. LSTM-SVM 35. GRU-SVM 36. RNN-SVM 37. CNN-SVM 38. MLP-SVM 39. LSTM-ARIMA-SVM 40. LSTM-MLP-SVM 41. LSTM-CNN-SVM 42. GRU-ARIMA-SVM 43. GRU-MLP-SVM 44. GRU-CNN-SVM 45. RNN-ARIMA-SVM 46. RNN-MLP-SVM 47. RNN-CNN-SVM 48. CNN-ARIMA-SVM 49. CNN-MLP-SVM 50. CNN-LSTM-SVM 51. CNN-GRU-SVM 52. ARIMA-RF 53. SARIMA-RF 54. VAR-RF 55. Auto-ARIMA-RF 56. Auto-SARIMA-RF 57. LSTM-RF 58. GRU-RF 59. RNN-RF 60. CNN-RF 61. MLP-RF 62. LSTM-ARIMA-RF 63. LSTM-MLP-RF 64. LSTM-CNN-RF 65. GRU-ARIMA-RF 66. GRU-MLP-RF 67. GRU-CNN-RF 68. RNN-ARIMA-RF 69. RNN-MLP-RF 70. RNN-CNN-RF 71. CNN-ARIMA-RF 72. CNN-MLP-RF 73. CNN-LSTM-RF 74. CNN-GRU-RF 75. ARIMA-XGBoost 76. SARIMA-XGBoost 77. VAR-XGBoost 78. Auto-ARIMA-XGBoost 79. Auto-SARIMA-XGBoost 80. LSTM-XGBoost 81. GRU-XGBoost 82. RNN-XGBoost 83. CNN-XGBoost 84. MLP-XGBoost 85. LSTM-ARIMA-XGBoost 86. LSTM-MLP-XGBoost 87. LSTM-CNN-XGBoost 88. GRU-ARIMA-XGBoost 89. GRU-MLP-XGBoost 90. GRU-CNN-XGBoost 91. RNN-ARIMA-XGBoost 92. RNN-MLP-XGBoost 93. RNN-CNN-XGBoost 94. CNN-ARIMA-XGBoost 95. CNN-MLP-XGBoost 96. CNN-LSTM-XGBoost 97. CNN-GRU-XGBoost 98. ARIMA-ANN 99. SARIMA-ANN 100. VAR-ANN 上面这些缩写模型的全称及相关用途功能详细解释
07-15

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值