Bert基于Transformer架构是解决自然语言处理的深度学习模型,常使用在文本分类、情感分析、词性标注等场合。
本文将使用Bert模型对中文文本进行分类,其中训练集数据18W条,验证集数据1W条,包含10个类别的文本数据,数据可以自己从Kaggel上下载。
中文新闻标题 | 类别标签 | 类别名 |
锌价难续去年辉煌 | 0 | 金融 |
金科西府 名墅天成 | 1 | 房地产 |
同步A股首秀:港股缩量回调 | 2 | 经济 |
状元心经:考前一周重点是回顾和整理 | 3 | 教育 |
一年网事扫荡10年纷扰开心网李鬼之争和平落幕 |