gpt-1用的是Byte-Pair-Encodingbert 与 electra 用的是WordPiecerobert和gpt-2 用的是byte-level Byte-Pair-Encoding [bbpe]xlnet与albert 用的是SentencePiece