参考链接
ALBERT是一个比BERT要轻量,效果更好的模型
ALBERT利用 词嵌入参数因式分解 和 隐藏层间参数共享 两种手段,显著减少了模型的参数量 的同时,基本没有损失模型的性能。
ALBERT输出的 第一个向量,可以 用来表征整体的输入文本
- 获取训练好的 ALBERT-zh 模型
参考链接
ALBERT是一个比BERT要轻量,效果更好的模型
ALBERT利用 词嵌入参数因式分解 和 隐藏层间参数共享 两种手段,显著减少了模型的参数量 的同时,基本没有损失模型的性能。
ALBERT输出的 第一个向量,可以 用来表征整体的输入文本