机器学习之SVM

最新推荐文章于 2023-12-30 10:39:50 发布

siegebaoniu

最新推荐文章于 2023-12-30 10:39:50 发布

阅读量1.1k

点赞数 1

分类专栏：机器学习文章标签：机器学习 svm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/siegebaoniu/article/details/77618587

版权

注：我主要看的是《机器学习实战》这本书

SVM又是复杂的章节，但号称是最好的分类算法，所以不得不看完，断断续续花了两周。（给我两个月也难以精通啊）

还是和以往一样，此书涉及的数学原理实在太少，如果是哪些喜欢问为什么的读者根本就看不下去，我也是其一。

后来又看了很多博客，知乎。又找了《统计学习方法》，专门看支持向量机那一节，才算稍微搞懂，但依旧还有不少疑问。

和往常一样，先分享一下心得，疑问呢先放一放。

本文会讲解一个最最简单的例子，来说明什么是SVM，什么是SMO，其中含拉格朗日乘子等一系列相关数学公式。。。

假设我们有三个点，（3，3），（4，3），（1，1），其中前两个点属于A类（红色），后一个属于B类（蓝色）。要求画一条线，将这两类分开。

那，分割线有非常多种，而下图的那条，则是SVM给出的最优的分割线。

他满足：（3，3），（1，1）两点到此线距离相等，且最大。

而（3，3），（1，1）这两点则被叫做支持向量，对分割线起到支持（决定）作用。

算法会认为（4，3）这个点离的较远，不会对分割线产生效果，有（3，3）这个点足矣。

不得不说，这个结论其实还挺好理解的。但究其背后的数学解法就比较复杂了。

先来说几个概念。

超平面：上图的那个直线方程其实就是超平面。因为给的例子是二维，二维中的分割是直线。三维中的分割是平面，那四维五维呢？不管了，统一叫“超平面”。

超平面的一般方程：

其中b为常数，w和x呢，都是多维的向量。

方便理解，我们还是举上述二维的例子。对二维来说，w含有两个系数，x则表示x坐标和y坐标。（wT表示转制）

所以对二维来说，超平面就是直线方程。例中：x+y-4=0

间隔：点到超平面的距离。（label表示分类，一定要取1或者-1。 1代表A类，-1代表B类）

嗯，继续举例子方便理解。

算一下点（3，3）到x+y-4=0的间隔。

函数间隔是1*2=2，几何间隔则再除一个根号2.

算一下点（1，1）到x+y-4=0的间隔。

函数间隔是-1*-2=2，几何间隔则再除一个根号2.

看到没，神奇不？两个点到这条线的间隔是相等的！（其实二维几何间隔把label去掉，再加一个绝对值的话，就是点到线段的距离公式了。）

下面要讲一堆数学公式了，讲讲怎么求出超平面！非战斗人员请撤离。

SVM的核心数学问题就是求解这么一个数学公式。

我觉得不难理解，从右往左看。

{ }里，右边就是几何间隔，n代表点的数目，我们这里

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习之SVM

注：我主要看的是《机器学习实战》这本书SVM又是复杂的章节，但号称是最好的分类算法，所以不得不看完，断断续续花了两周。（给我两个月也难以精通啊）还是和以往一样，此书涉及的数学原理实在太少，如果是哪些喜欢问为什么的读者根本就看不下去，我也是其一。后来又看了很多博客，知乎。又找了《统计学习方法》，专门看支持向量机那一节，才算稍微搞懂，但依旧还有不少疑问。和往常一样，先分享一下心得，疑问
复制链接

扫一扫

专栏目录

siegebaoniu CSDN认证博客专家 CSDN认证企业博客

码龄16年

22: 原创

31万+: 周排名

213万+: 总排名

5万+: 访问

: 等级

878: 积分

50: 粉丝

7: 获赞

5: 评论

13: 收藏

私信

关注

热门文章

分类专栏

Cube 5篇
正则表达式 1篇
C# 9篇
oracle 10篇
sqlServer 40篇
机器学习 2篇

最新评论

在Oracle建立CDC
m3gaf0rce: 好的。
在Oracle建立CDC
siegebaoniu: 也可以省去订阅，如果你有权限直接查看发布的话。这样会少掉很多步骤，并不用建那个奇怪的Job。 [code=sql] --sys BEGIN DBMS_CAPTURE_ADM.PREPARE_TABLE_INSTANTIATION(TABLE_NAME => 'eapp.Usertable'); --input tableName END; --cdcpub BEGIN DBMS_CDC_PUBLISH.CREATE_CHANGE_SET( change_set_name => 'CS_eappUsertable', --input changesetName change_source_name => 'HOTLOG_SOURCE', stop_on_ddl => 'y' ); END; --cdcpub BEGIN DBMS_CDC_PUBLISH.CREATE_CHANGE_TABLE( owner => 'cdcpub', change_table_name => 'eappUsertable_ct', --Input ChangeTableName change_set_name => 'CS_eappUsertable', source_schema => 'eapp', --Input SourceSchema source_table => 'Usertable', --Input SourceTable column_type_list =>'ID INT, UserName varchar2(100), dt date', capture_values => 'both', rs_id => 'y', row_id => 'n', user_id => 'n', timestamp => 'n', object_id => 'n', source_colmap => 'n', target_colmap => 'y', options_string => ''); END; BEGIN DBMS_CDC_PUBLISH.ALTER_CHANGE_SET( change_set_name => 'CS_eappUsertable', enable_capture => 'y'); END; [/code]
zz)在SSIS 2012 中使用CDC 数据变化捕获
siegebaoniu: 要是在CDC source中选了净值，就不必在意3还是4了。只会抓新的值过来，但是净值分为3种，净值，更新掩码后的净值，合并后的净值。
zz)在SSIS 2012 中使用CDC 数据变化捕获
siegebaoniu: 1. 要求表有唯一键。 2. update那边需要的标志位判断，否则3和4（新老数据）都抓过来。。 3. 表结构没法更新，增列没反应，删列ETL就报错了吧。 4. 一张表要生成个系统CT表，做个ETL导变更，太麻烦。据说Oracle的CDC是封装好的，不过是收费的。SQL Server的集成在SSIS里，自己写累死人。 5. 这个需求不如用数据库复制，简便。不知道性能和网络要求多大。
Oracle里3种游标
gyhixq: erf

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。