没啥解释的,之前写过的一篇,再次回顾之后,发现之前在似懂非懂的情况下写的,貌似还行,那就之前贴过来了,后续有其它的感悟,再来补充: bert详解(一)----预训练源码 后续的话,准备写一下之前了解过的albert和robert了,放一块写了。