NLP从入门到如土🤮
文章平均质量分 96
知更鸟11
这个作者很懒,什么都没留下…
展开
-
【NLP练级之路 第三篇】Beyond Prompting: Making Pre-trained Language Models Better Zero-shot Learners by Clust
现在的zero-shot TC的研究要么是有繁杂的人体工程或复杂的self-training过程,阻碍了它们在新情况下的应用。在这一工作中,我们证明了在PLMS嵌入空间中对文本进行聚类可以简单地改进零镜头文本分类。【聚类的方法】在使用类名初始化聚类位置和形状后,我们用贝叶斯-高斯混合模型对未标记文本进行拟合。尽管简单,但该方法在主题和情感分类数据集上都取得了优越或可比的性能,并且在非平衡数据集上的性能显著优于以往的工作。原创 2023-04-09 00:59:01 · 300 阅读 · 0 评论 -
【NLP练级之路 第二篇】Zero-Shot Text Classification with Self-Training
self-training的zero-shot文本分类问题原创 2023-04-07 18:02:13 · 969 阅读 · 0 评论 -
【NLP练级之路 第一篇】Text Classification Using Label Names Only: A Language Model Self-Training Approach
介绍论文录取EMNLP发布单位伊利诺伊大学香槟分校韩家炜老师课题组论文链接论文源码github地址主流的分本分类方法是基于预训练+微调的模式,而文本分类作为下游任务,需要标记数据进行辅助训练,也即是训练集数据,但是训练集的数据获取费时费力。后来的一部分研究转向于以基于描述要类别的一小组词进行分类,不需要训练数据,而本文中提出的方法在未标记数据上只使用每个类的标签名训练分类模型的潜力。原创 2023-04-02 01:17:09 · 190 阅读 · 0 评论