为了方便大家更好的学习和提问,特建立微信群
深度学习 | L3 | 深度学习有没有用到归一化?用到了什么归一化?归一化的操作是什么?有什么作用? | |
深度学习 | L3 | 数据不均匀对模型训练有什么影像,数据分布不均匀的问题怎么解决 | |
深度学习 | L3 | bert的架构是什么 目标是什么 输入包括了什么 三个embedding输入是怎么综合的 | |
深度学习 | L3 | transformer里面每一层的主要构成有哪些 | |
深度学习 | L3 | bert中MLM任务的具体策略是什么 | |
深度学习 | L3 | bert的mask策略 | |
深度学习 | L3 | BERT结构、transformer中feed forward的作用 |