如果数据量多的话,可以试试不加载已经预训练好的模型。 南方的仔回复叫我老周就好了 (作者)2019-04-10 数据16万条,但是不加载预训练的话那不就是从头开始训练了吗?官方啊说要很久唉 一起读Bert文本分类代码 (pytorch篇 六) - 知乎