几个nlp的小项目(文本分类)
导入加载数据类、评测类
load_dataset: 加载数据集
load_metric:加载评测类
查看数据集
精确展示数据
测评方法
传入 预测值和具体值
设置参数
task: 选择的任务,可加载数据集
model_checkpoint: 设置加载模型的名称
batch_size: 批量大小
distilbert-base-uncased模型介绍
tokenizer,token化的解释
数据喂入模型前,首先要对数据进行预处理操作。
预处理工具为:Tokenizer。 (Tokenizer首先对输入进行tokenize,然后将tokens转化为预模型中需要对应的token ID,再转化为模型需要的输入格式。)
对数据集进行预处理
加载预训练模型进行训练
设置训练模型的参数
一个根据任务名获取,测评方法的函数
创建预训练模型
开始训练
本项目的工作完成了什么任务?
判断了 某个句子的语法是否正确,根据label进行反向传播训练!