hscreamom-CSDN博客

原创机器学习要点（三）：模型泛化相关

欠拟合解决方法：1、添加其他特征项，或者添加模型的多项式特征2、减少正则化参数，正则化的目的是用来防止过拟合的，但是现在模型出现了欠拟合，则需要减少正则化参数。3、因数据量不够导致，重采样或者迁移学习过拟合解决方法：数据层面：1、重新清洗数据，导致过拟合的一个原因也有可能是数据不纯导致的，如果出现了过拟合就需要我们重新清洗数据。2、增大数据的训练量，还有一

2017-10-12 01:26:31 315

原创机器学习要点（二）：数据处理相关

重采样技术1、随机欠采样优点：它可以提升运行时间；并且当训练数据集很大时，可以通过减少样本数量来解决存储问题。缺点：它会丢弃对构建规则分类器很重要的有价值的潜在信息。被随机欠采样选取的样本可能具有偏差。它不能准确代表大多数。从而在实际的测试数据集上得到不精确的结果。2、随机过采样优点：与欠采样不同，这种方法不会带来信息损失。表现优于欠采样。缺点：由于复制少数类事

2017-10-11 15:04:39 714

原创机器学习要点（一）：梯度相关

梯度消失与爆炸本质原因：梯度反向传播时，由于连乘造成的现象。网络训练的时候，采用的反向传播方式，该方式背后其实是链式求导，计算每层梯度的时候会涉及一些连乘操作，因此如果网络过深，那么如果连乘的因子大部分小于1，最后乘积可能趋于0；另一方面，如果连乘的因子大部分大于1，最后乘积可能趋于无穷。这就是所谓梯度消失与梯度爆炸。具体原因：1、使用sigmoid激励函数，sigmoid激励函

2017-10-09 17:26:01 1039

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 机器学习要点（三）：模型泛化相关

原创 机器学习要点（二）：数据处理相关

原创 机器学习要点（一）：梯度相关

空空如也

空空如也

原创机器学习要点（三）：模型泛化相关

原创机器学习要点（二）：数据处理相关

原创机器学习要点（一）：梯度相关