MDN (Mixture Density Network) 神经网络可以用来拟合任意非线性的条件概率分布 P ( y ∣ x ) P(y|x) P(y∣x). 原理是输出定义的 K K K个高斯分布的 π , σ ,
【pytorch】MDN模型高斯分布概率计算的溢出问题
最新推荐文章于 2024-10-29 08:00:00 发布
文章讨论了MixtureDensityNetwork在处理5维输入1维输出时遇到的数值计算挑战,特别是由于exp函数导致的loss为inf和nan问题。作者采用了torch库的normal类和log_prob、logsumexp函数来确保计算的稳定性和准确性,并在GitHub上提交了相关issue及代码。
摘要由CSDN通过智能技术生成