稀疏性的优点

最新推荐文章于 2024-04-19 08:50:23 发布

GUI Research Group

最新推荐文章于 2024-04-19 08:50:23 发布

阅读量2.2k

点赞数 2

分类专栏：机器学习文章标签：机器学习

原文链接：https://blog.csdn.net/a362682954/article/details/85226022

版权

机器学习专栏收录该内容

413 篇文章 55 订阅 ¥99.90 ¥299.90

订阅专栏

稀疏性在机器学习中带来了诸多好处，如自动特征选择，提高模型的可解释性，以及降低存储需求。通过稀疏规则化，可以过滤掉无关特征，使模型更加聚焦于关键因素，便于理解和分析。此外，对于线性可分问题，稀疏性降低了学习难度。

摘要由CSDN通过智能技术生成

稀疏指的是参数或者数据中零的个数,零的个数越多,参数或者数据就越稀疏.这种稀疏性带来许多优点.

参数稀疏有什么好处

1）特征选择(Feature Selection)：大家对稀疏规则化趋之若鹜的一个关键原因在于它能实现特征的自动选择。一般来说， $x i$ 的大部分元素（也就是特征）都是和最终的输出yi没有关系或者不提供任何信息的，在最小化目标函数的时候考虑xi这些额外的特征，虽然可以获得更小的训练误差，但在预测新的样本时，这些没用的信息反而会被考虑，从而干扰了对正确yi的预测。稀疏规则化算子的引入就是为了完成特征自动选择的光荣使命，它会学习地去掉这些没有信息的特征，也就是把这些特征对应的权重置为0。

2）可解释性(Interpretability)：另一个青睐于稀疏的理由是，模型更容易解释。例如患某种病的概率是 $y$ ，然后我们收集到的数据 $x$ 是1000维的，也就是我们需要寻找这1000种因素到底是怎么影响患上这种病的概率的。假设我们这个是个回归模型： $y = w 1 * x 1 + w 2 * x 2 + \dots + w 1000 * x 1000 + b$ （当然了，为了让y限定在[0,1]的范围，一般还得加个Logistic函数）。通过学习，如果最后学习到的 $w *$ 就只有很少的非零元素，例如只有5个非零的 $w i$ ，那么我们就有理由相信，这些对应的特征在患病分析上面提供的信息是巨大的，决策性的。也就是说，患不患这种病只和这5个因素有关，那医生就好分析多了。但如果1000个 $w i$ 都非0，医生面对这1000种因素.