Does syntax matter? A strong baseline for Aspect-based Sentiment Analysis with RoBERTa
如果有大神会的话,求指点呀,学四年造价来改进模型,我心也是崩的一批。
1.fastNLP报错
from fastnlp import (accuracymetric, bucketsampler, classifyfprerecmetric, importerror: cannot import name 'accuracymetric' from 'fastnlp'
解决:
pip install fastNLP==0.7.0
2.读要求--本文重现整个实验包括四个步骤:
①使用Train文件夹中的代码对ALSC数据集进行微调模型,微调后将保存微调后的模型。
②使用Perturbed-Masking文件夹中的代码生成诱导树,这将输出数据集作为不同模型的输入。
③根据特定的模型生成不同输入格式的数据。
④在ASGCN、PWCN和RGAT中运行代码。
我们对ASGCN、PWCN、RGAT和perturded - masking的原始代码做了必要的修改。我们所做的所有更改都是开源的。我们相信所有的更改都是在MIT许可下进行的。如果按照原始步骤运行上面的代码,可能会引发错误。我们建议按照相应文件夹中的自述说明运行它们(ASGCN, PWCN, RGAT和pertursed - masking)。
论文中的学习率写错了,应该给RoBERTa改到2e -5。记住在您自己的数据上分割验证集。“dev”参数应该用finetune.py训练器中相应的验证文件路径填充。我们在这里没有提供验证集分区,这是我们以前忽略的一个问题。然而在我们的实验实施中,我们使用验证集来评估不同诱导树的性能。
3.运行Train。我要我要运行train!!!!!!!!!!!!!!!!!!
3.1readme
此文件夹主要包含ABSA数据集上的微调模型代码。Pipe.py预处理数据。py对模型进行微调,微调后也会保存微调后的模型。
代码基于fastNLP和Fitlog。更多信息可以在fastNLP和fitlog中找到。代码将使用名为Train/Test的数据文件。在{data dir}/{dataset}文件夹下,例如{RoBERTaABSA/ dataset} /{Restaurant},所以请确保这两个文件可用。
但是fastNLP那个网站不好用了,我就自己下载了bert的文件,放到了文件夹里。
由于作者用的是LINUX系统,我是Windows系统,所以在代码上做了简单的改变。
虽然说起来云淡风轻,但却花了两天时间,多次想着要放弃,因为是在学不会,但这只是第一步,希望自己可以蹲到自己的后续!!!
同时感谢这位大佬的博文为我拨开云雾!
祝大家科研顺利!!!