mRASP2数学模型
本博客主要记录mRASP2的数学模型和公式。若有错误理解,恳请加以评论。
模型图
公式表示
我们定义了集合L={L1,L2,⋯ ,LM}L=\{L_1,L_2,\cdots,L_M\}L={L1,L2,⋯,LM},集合LLL表示为涉及训练阶段的MMM个语言的集合。
DDD表示所有的并行数据集,DijD_{ij}Dij表示(Li,Lj)(L_i,L_j)(Li,Lj)的一个并行数据集。
训练损失定义为:
Lce=∑xi,xj∈D−logPθ(xi∣xj)
L_{ce}=\sum_{x^i,x^j
原创
2021-12-23 20:36:22 ·
1003 阅读 ·
0 评论