稀疏性的优点

413 篇文章 55 订阅 ¥99.90 ¥299.90
稀疏性在机器学习中带来了诸多好处,如自动特征选择,提高模型的可解释性,以及降低存储需求。通过稀疏规则化,可以过滤掉无关特征,使模型更加聚焦于关键因素,便于理解和分析。此外,对于线性可分问题,稀疏性降低了学习难度。
摘要由CSDN通过智能技术生成

稀疏指的是参数或者数据中零的个数,零的个数越多,参数或者数据就越稀疏.这种稀疏性带来许多优点.

参数稀疏有什么好处

1)特征选择(Feature Selection): 大家对稀疏规则化趋之若鹜的一个关键原因在于它能实现特征的自动选择。一般来说, x i xi xi的大部分元素(也就是特征)都是和最终的输出yi没有关系或者不提供任何信息的,在最小化目标函数的时候考虑xi这些额外的特征,虽然可以获得更小的训练误差,但在预测新的样本时,这些没用的信息反而会被考虑,从而干扰了对正确yi的预测。稀疏规则化算子的引入就是为了完成特征自动选择的光荣使命,它会学习地去掉这些没有信息的特征,也就是把这些特征对应的权重置为0。

2)可解释性(Interpretability): 另一个青睐于稀疏的理由是,模型更容易解释。例如患某种病的概率是 y y y,然后我们收集到的数据 x x x是1000维的,也就是我们需要寻找这1000种因素到底是怎么影响患上这种病的概率的。假设我们这个是个回归模型: y = w 1 ∗ x 1 + w 2 ∗ x 2 + … + w 1000 ∗ x 1000 + b y=w1*x1+w2*x2+…+w1000*x1000+b y=w1x1+w2x2++w1000x1000+b(当然了,为了让y限定在[0,1]的范围,一般还得加个Logistic函数)。通过学习,如果最后学习到的 w ∗ w* w就只有很少的非零元素,例如只有5个非零的 w i wi wi,那么我们就有理由相信,这些对应的特征在患病分析上面提供的信息是巨大的,决策性的。也就是说,患不患这种病只和这5个因素有关,那医生就好分析多了。但如果1000个 w i wi wi都非0,医生面对这1000种因素.

稀疏性优点总结
  • 大多数问题线性可分,学习任务的难度有所减低;

  • 易于存储,数据中零的个数多时,可以使用算法减少存储空间;

  • 可解释性提高.

参考:https://www.jianshu.com/p/8025b6c9f6fa

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值