- 博客(3)
- 收藏
- 关注
原创 机器学习要点(三):模型泛化相关
欠拟合解决方法:1、添加其他特征项,或者添加模型的多项式特征2、减少正则化参数,正则化的目的是用来防止过拟合的,但是现在模型出现了欠拟合,则需要减少正则化参数。3、因数据量不够导致,重采样或者迁移学习 过拟合解决方法:数据层面:1、重新清洗数据,导致过拟合的一个原因也有可能是数据不纯导致的,如果出现了过拟合就需要我们重新清洗数据。2、增大数据的训练量,还有一
2017-10-12 01:26:31 315
原创 机器学习要点(二):数据处理相关
重采样技术1、 随机欠采样优点:它可以提升运行时间;并且当训练数据集很大时,可以通过减少样本数量来解决存储问题。缺点:它会丢弃对构建规则分类器很重要的有价值的潜在信息。被随机欠采样选取的样本可能具有偏差。它不能准确代表大多数。从而在实际的测试数据集上得到不精确的结果。2、 随机过采样优点:与欠采样不同,这种方法不会带来信息损失。表现优于欠采样。缺点:由于复制少数类事
2017-10-11 15:04:39 714
原创 机器学习要点(一):梯度相关
梯度消失与爆炸本质原因:梯度反向传播时,由于连乘造成的现象。网络训练的时候,采用的反向传播方式,该方式背后其实是链式求导,计算每层梯度的时候会涉及一些连乘操作,因此如果网络过深,那么如果连乘的因子大部分小于1,最后乘积可能趋于0;另一方面,如果连乘的因子大部分大于1,最后乘积可能趋于无穷。这就是所谓梯度消失与梯度爆炸。 具体原因:1、使用sigmoid激励函数,sigmoid激励函
2017-10-09 17:26:01 1039
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人