参考网址
https://www.yinxiang.com/everhub/note/c9c56496-cc07-4cf3-81d4-ff2a3353272f (bert三种token方式详解,这篇博客较详细地介绍了bert的3种token方式)
https://github.com/fighting41love/funNLP (各种词库)
https://tech.meituan.com/2019/11/14/nlp-bert-practice.html (美团实践)
https://blog.csdn.net/u011984148/article/details/99921480 (词向量详解)
https://www.jiqizhixin.com/articles/2019-06-27-17 (各种词典的构造方法)
https://www.jiqizhixin.com/sota (分类的项目)
http://fancyerii.github.io/2019/03/09/bert-codes/ (bert代码详解)
https://cloud.tencent.com/developer/article/1449248 (从字到词,大词典中文BERT模型的探索之旅;目前这篇博客报道的是基于词的bert预训练模型在公开数据集上还比基于字的逊色一些)
http://fancyerii.github.io/2019/03/09/bert-codes/ (这是我见过bert代码分析最全的一篇blog;里面bert的词构建很详细)