Xavier初始化方法: https://blog.csdn.net/shuzfan/article/details/51338178
优化策略Label Smoothing: https://zhuanlan.zhihu.com/p/27678647
softmax与log_softmax: https://blog.csdn.net/lanchunhui/article/details/51248184
NLP训练所用到的一些方法
最新推荐文章于 2024-08-16 11:24:16 发布