本次我们学习的内容是基于MindSpore实现BERT对话情绪识别
BERT(Bidirectional Encoder Representations from Transformers)是Google于2018年发布的一种新型语言模型,在许多自然语言处理任务中表现优异。
如图模型简介
接着就是进行数据集准备
数据集
这里提供一份已标注的、经过分词预处理的机器人聊天数据集,来自于百度飞桨团队。数据由两列组成,以制表符('\t')分隔,第一列是情绪分类的类别(0表示消极;1表示中性;2表示积极),第二列是以空格分词的中文文本,如下示例,文件为 utf8 编码。
0--谁骂人了?我从来不骂人,我骂的都不是人,你是人吗 ?
1--我有事等会儿就回来和你聊
2--我见到你很高兴谢谢你帮我
这部分主要包括数据集读取,数据格式转换,数据 Tokenize 处理和 pad 操作。
接着进行数据加载和数据预处理
注:昇腾NPU环境下暂不支持动态Shape,数据预处理部分采用静态Shape处理
接着进行模型的构建
模型验证推理
最后附上打卡时间