BertClassifier
本文利用了transformers中的BertModel
,对部分cnews
数据集进行了文本分类,在验证集上的最优Acc
达到了0.92
,拿来对BERT模型练手还是不错的。
数据描述
数据集是从清华大学的THUCNews中提取出来的部分数据。
训练集中有5
万条数据,分成了10
类,每类5000
条数据。
{"体育": 5000, "娱乐": 5000, "家居": 5000, "房产": 5000, "教育": 5000, "时尚": 5000, "时政": 5000, "游戏": 5000, "科技": 5000,