机器学习记录—传统模型

1、前言

自己总结的一些问题的答案,都是个人拙见,算是一个记录,防止自己遗忘,如果有错误,欢迎指正。

2、内容

2.1 线性模型

Sigmoid的优缺点

优点:Sigmoid能将数据压缩在0,1之间,适合于概率预测,其次方便求导

缺点:sigmoid()函数存在饱和区,在反向传播时候容易造成梯度消失

SVM多分类怎么处理?

SVM本身是为了二分类问题实际的,处理多分类问题则需要构造合适的分类器

有一种直接的办法是修改目标函数

将多个分类面的参数求解合并成一个最优问题,通过求解这个问题实现多分类,但缺点是计算复杂度高

第二种是构建多个二分类器,常用的有一对多和一对一

  • 一对多就是在训练时将某类样本归于一类,别的样本归于另一类,一次构造n个svm模型,分类时就将样本分为最可能那一类
  • 一对一就是对任意两个类别样本设计一个SVM,这样k个样本就需要设计k(k-1)/2个SVM,对样本分类时,得票最多的类别就是该样本的类别,libsvm多分类就是这么实现的

还有层次SVM,就是所有类别分为两子类,两个子类继续划分知道得到一个单独的类

2.2 聚类模型

Kmeans算法流程

  1. 根据设定的聚类数,随机从数据集中选择k个样本作为初始聚类中心
  2. 计算每个对象到聚类中心的距离,如果样本距离某个聚类簇最近,则重新划分
  3. 然后计算每个簇中样本的平均位置,选择该点为聚类中心
  4. 重复上述过程

2.3 集成学习

为什么Boosting降偏差,Bagging降方差?

从计算角度而言

从方差的计算我们可以知道,如果子模型完全独立,bagging后可以显著降低方差,如果子模型完全相同,则难以降低方差。

因为bagging采用的是自助采样法,其子样本集有一定相似性,且使用的是同一类模型,因此各模型之间的偏差和方差近似,通过计算可知bagging后的偏差和单个子模型接近,一般来说不能显著降低偏差。而bagging的子模型则具有一定的相关性,所以可以在一定程度上降低方差。

对于boosting,它使用的是前向分步算法和加性模型去优化loss,这就导致了boosting的子模型之间强相关,我们知道如果子模型高度相似,是难以降低方差的,但是由于其是串行地最小化loss,其偏差是会逐渐降低的,就通过多个弱分类器加权相加所得的强分类器来降低偏差,达到不错的拟合效果。

从模型思想的角度而言

一般而言,简单模型的方差低而偏差高,复杂模型的方差高而偏差低。

Boosting的目的是为了提高模型拟合程度,一般采用的是弱分类器来组合而成强分类器,可以认为是在不断降低偏差,而bagging的简单投票、简单平均法是为了增加其抗干扰能力,于使用多个稍强的模型进行并行训练,可以认为是在降低方差

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
audit_risk机器学习是一种应用机器学习算法来预测审计风险的方法。审计风险是指在进行审计过程中可能出现的错误或欺诈行为的风险。通过利用机器学习技术,可以从大量的审计数据中学习并建立预测模型,以帮助审计人员更准确地评估审计风险,并提供更有效的审计决策。 使用机器学习算法进行审计风险预测可以提供以下几方面的优势: 首先,机器学习可以从大规模的审计数据中自动学习并发现隐藏在数据中的模式和规律。相比传统的手动分析方法,机器学习可以更全面、更准确地分析数据,降低主观因素的干扰,提高预测的准确性。 其次,机器学习算法可以根据不同的审计数据特征进行分类和预测。例如,可以根据客户的历史记录、交易数据、员工行为等多维度数据进行风险评估,并对不同风险级别的客户进行分类和筛选,使审计人员能够更有针对性地进行审计工作。 此外,机器学习还可以进行异常检测和欺诈检测。通过学习正常的审计数据模式,机器学习可以自动检测出异常数据和潜在的欺诈行为,帮助审计人员及时识别和应对风险。 需要注意的是,机器学习虽然能够提供更准确的预测和辅助决策能力,但模型的准确性和可靠性也受到数据的质量和样本的代表性等因素的影响。因此,在应用机器学习算法进行审计风险预测时,需要对数据进行准确性和完整性的验证,选择合适的算法和模型,并对模型进行不断的监控和更新,以确保预测结果的可信度和有效性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值