问题解决
沃柑火龙果
这个作者很懒,什么都没留下…
展开
-
当BatchNormalize遇到异常值,导致预测结果都是NaN
问题背景最近使用DNN模型来做排序,发现近几天的NDCG离线指标下跌得很厉害。于是下载模型自己在本地评测了一下,预测结果都是NaN,于是把各层的模型参数以及各层的输出都打印出来,发现BatchNormalize中的moving_variance(方差)的某一维是NaN,最后一查果然是这一维特征异常了。为了把事情弄清楚,写这个blog记录一下。BatchNormalize(BN)基础知识BN的提出是为了解决神经网络中Internal Covariate Shift的问题,Internal Covaria原创 2020-06-01 22:32:27 · 1995 阅读 · 0 评论 -
样本缺失处理导致xgboost4j-spark生成模型在线上预测出现的问题追查
提纲问题发现问题追查问题产生原因问题总结啊啊啊,被迫重新营业,最近决定把遇到的一些问题及解决方案放到CSDN上,做简单的记录,至于系统性的知识还是自己搭个博客吧~问题发现为了使用样本权重,最近将xgboost4j-spark升级到0.9版本,跑了个模型auc看起来还行,生成的模型放到线上,效果惨不忍睹。不应该啊,于是对比了下线上和线下的打分没有一致,线下用的是xgboost4j-spark的...原创 2020-03-14 22:51:27 · 787 阅读 · 0 评论