BERT相关论文、文章和代码资源汇总

BERT最近太火,蹭个热点,整理一下相关的资源,包括Paper, 代码和文章解读。
1、Google官方:

  1. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

一切始于10月Google祭出的这篇Paper, 瞬间引爆整个AI圈包括自媒体圈: https://arxiv.org/abs/1810.04805

  1. Github: https://github.com/google-research/bert

11月Google推出了代码和预训练模型,再次引起群体亢奋。

  1. Google AI Blog: Open Sourcing BERT: State-of-the-Art Pre-training for Natural Language Processing

2、第三方解读:

  1. 张俊林博士的解读, 知乎专栏:从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史

我们在AINLP微信公众号上转载了这篇文章和张俊林博士分享的PPT,欢迎关注:

从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史
预训练在自然语言处理的发展: 从Word Embedding到BERT模型
2) 知乎: 如何评价 BERT 模型?

  1. 【NLP】Google BERT详解

  2. [NLP自然语言处理]谷歌BERT模型深度解析

  3. BERT Explained: State of the art language model for NLP

  4. BERT介绍

  5. 论文解读:BERT模型及fine-tuning

  6. NLP突破性成果 BERT 模型详细解读

3、第三方代码:

  1. pytorch-pretrained-BERT: https://github.com/huggingface/pytorch-pretrained-BERT
    Google官方推荐的PyTorch BERB版本实现,可加载Google预训练的模型:PyTorch version of Google AI’s BERT model with script to load Google’s pre-trained models

  2. BERT-pytorch: https://github.com/codertimo/BERT-pytorch
    另一个Pytorch版本实现:Google AI 2018 BERT pytorch implementation

  3. BERT-tensorflow: https://github.com/guotong1988/BERT-tensorflow
    Tensorflow版本:BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

  4. bert-chainer: https://github.com/soskek/bert-chainer
    Chanier版本: Chainer implementation of “BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding”

  5. bert-as-service: https://github.com/hanxiao/bert-as-service
    将不同长度的句子用BERT预训练模型编码,映射到一个固定长度的向量上:Mapping a variable-length sentence to a fixed-length vector using pretrained BERT model
    这个很有意思,在这个基础上稍进一步是否可以做一个句子相似度计算服务?有没有同学一试?

  6. bert_language_understanding: https://github.com/brightmart/bert_language_understanding
    BERT实战:Pre-training of Deep Bidirectional Transformers for Language Understanding: pre-train TextCNN

  7. sentiment_analysis_fine_grain: https://github.com/brightmart/sentiment_analysis_fine_grain
    BERT实战,多标签文本分类,在 AI Challenger 2018 细粒度情感分析任务上的尝试:Multi-label Classification with BERT; Fine Grained Sentiment Analysis from AI challenger

  8. BERT-NER: https://github.com/kyzhouhzau/BERT-NER
    BERT实战,命名实体识别: Use google BERT to do CoNLL-2003 NER !

  9. BERT-keras: https://github.com/Separius/BERT-keras
    Keras版: Keras implementation of BERT with pre-trained weights

  10. tbert: https://github.com/innodatalabs/tbert
    PyTorch port of BERT ML model

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
BERT(Bidirectional Encoder Representations from Transformers)是一种预训练语言模型,可以用于各种自然语言处理任务的微调。下面是BERT预训练和微调的简要介绍: BERT预训练: BERT的预训练是指在大规模文本上训练出一个通用的语言模型,然后将这个模型微调到各种具体的NLP任务上。预训练BERT包含两个阶段:Masked Language Model(MLM)和Next Sentence Prediction(NSP)。在MLM阶段,部分输入单词被随机替换成[Mask]标记,模型需要预测这些[Mask]标记对应的原始单词;在NSP阶段,模型需要判断两个句子是否是连续的。BERT的预训练代码可以使用谷歌官方实现的TensorFlow版本或者Hugging Face开发的PyTorch版本。 BERT微调: BERT微调是指在任务特定的数据集上微调预训练好的BERT模型。微调步骤包括数据处理、模型配置、模型微调和模型评估。在数据处理阶段,需要将任务特定数据集转换成适合BERT输入的格式;在模型配置阶段,需要根据任务需求选择合适的模型结构、超参数和优化器;在模型微调阶段,需要用微调数据集对模型进行训练;在模型评估阶段,需要使用测试集对微调后的模型进行评估。BERT微调代码可以使用各种框架实现,如PyTorch、TensorFlow等。 如果您想学习更多关于BERT预训练和微调的内容,我建议您查看谷歌官方论文和Hugging Face官方文档。此外,您也可以在GitHub上找到各种不同的BERT实现和教程。如果您需要具体的代码示例,可以告诉我您所使用的框架和任务类型,我可以为您提供相关参考。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值