机器学习其他常用技术

参考视频https://www.bilibili.com/video/BV1zgXGYuESx

5.1 决策树算法

一种对实例进行分类的树形结构,通过多层判断区分目标所属类别

本质:通过多层判断,从训练数据集中归纳出一组分类规则

优点:

  1. 计算量小,运算速度快
  2. 易于理解,可清晰查看各属性的重要性

缺点:

  • 忽略属性间的相关性
  • 样本类别分布不均匀时,容易影响模型表现

决策树求解

 问题核心:特征选择,每一个节点,应该选用哪个特征。

三种求解方法:ID3、C4.5、CART

ID3

利用信息熵原理选择信息增益最大的属性作为分类属性,递归地拓展决策树的分枝,完成决策树的构造。

Ent(D)值越小,变量的不确定性越小。

p_{k}=1时,Ent(D)=0

即为划分前的信息熵减去划分后的信息熵

目标:划分后样本分布不确定性尽可能小,即划分后信息熵小,信息增益大

5.2 异常检测

根据输入数据,对不符合预期模式的数据进行识别

概率密度

概率密度函数是一个描述随机变量在某个确定的取值点附近的可能性的函数

P(x_{1},x_{2})=\int_{x_{1}}^{x_{2}}p(x)dx

高斯分布

  

5.3 主成分分析

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值