BERT使用详解(实战)

最新推荐文章于 2024-08-16 13:29:44 发布

胡文祥

最新推荐文章于 2024-08-16 13:29:44 发布

阅读量7.8k

点赞数 4

分类专栏：人工智能机器学习自然语言处理文章标签：机器学习人工智能 bert

本文链接：https://blog.csdn.net/foxcow2012/article/details/87856557

版权

本文详细介绍了BERT模型的下载、加载与使用方法，包括不同版本的BERT模型、加载模型的代码示例以及使用模型进行预测的步骤。还强调了在使用过程中需要注意的要点，如输入长度限制、内存需求等。

摘要由CSDN通过智能技术生成

BERT模型，本质可以把其看做是新的word2Vec。对于现有的任务，只需把BERT的输出看做是word2vec，在其之上建立自己的模型即可了。

1，下载BERT

BERT-Base, Uncased: 12-layer, 768-hidden, 12-heads, 110M parameters
BERT-Large, Uncased: 24-layer, 1024-hidden, 16-heads, 340M parameters
BERT-Base, Cased: 12-layer, 768-hidden, 12-heads , 110M parameters
BERT-Large, Cased: 24-layer, 1024-hidden, 16-heads, 340M parameters
BERT-Base, Multilingual Cased (New, recommended): 104 languages, 12-layer, 768-hidden, 12-heads, 110M parameters
BERT-Base, Multilingual Uncased (Orig, not recommended) (Not recommended, use Multilingual Cased instead): 102 languages, 12-layer, 768-hidden, 12-heads, 110M parameters