首先百度提供的Easy DL平台能帮助我们做很多实验,本文只要针对文本分类任务。平台所提供的方法节省了大量的自主编码时间。
1、打开百度EasyDL,选择专业版。
2、上传情感分类数据集,Easy DL做文本分类任务时自带数据集,所以可以选取官方指定数据集,也可以上传自己的数据集。数据集格式必须是txt格式,包含句子和标注。
提供的公开数据集有如下选择
3、创建新的项目并创建新的任务
配置任务中可以选择百度的ERNIE2.0预训练模型加上BILSTM神经网络。这里的网络包括CNN、TextCNN、LSTM、GRU、BiLSTM、BOW,所以可以做很多对比试验。并且也可以不选用语言模型,单纯用神经网络去做实验。
4、脚本编辑
整个模型的脚本是可以编辑的,意味着可以调整参数以及自己增加网络,比如再自己添加一个全连接网络。