DBN on Imbalance Data 问题所在
简介
DBN被证明是一种相当有用的机器学习分类方法。通常DBN被要求训练像MNIST(train set 60,000)一样大量的数据集。对DBN来说,不平衡数据尤其是个问题,会导致预训练有很强的偏差,就算用大量的标签来做监督性学习的微调,也很难将偏差消除掉。对于我们现在所用的数据,正样本仅占5%左右,大量的负样本造成了分类结果向负样本方向偏移,很难识别
DBN on Imbalance Data 问题所在
DBN被证明是一种相当有用的机器学习分类方法。通常DBN被要求训练像MNIST(train set 60,000)一样大量的数据集。对DBN来说,不平衡数据尤其是个问题,会导致预训练有很强的偏差,就算用大量的标签来做监督性学习的微调,也很难将偏差消除掉。对于我们现在所用的数据,正样本仅占5%左右,大量的负样本造成了分类结果向负样本方向偏移,很难识别