NLP
文章平均质量分 97
Twilight Sparkle.
学无止尽
展开
-
【NLP】多标签分类【下】
在《【NLP】多标签分类》系列的上一篇文章中,我们深入探讨了三种机器学习方法:Binary Relevance (BR)、Classifier Chains (CC) 以及 Label Powerset (LP),旨在解决多标签分类的挑战。这些方法各展所长,为我们提供了不同角度解析和处理多标签问题的视角。继先前对这些机器学习方法的详尽分析之后,本篇文章转向更为先进的解决策略——专注于序列生成方法,并以Transformer模型的一种变体,即T5预训练模型为核心,进行实验探索。原创 2024-04-08 18:19:31 · 1307 阅读 · 0 评论 -
【NLP】多标签分类【上】
《【NLP】多标签分类》主要介绍利用三种机器学习方法和一种序列生成方法来解决多标签分类问题(包含实验与对应代码)。共分为上下两篇,上篇聚焦三种机器学习方法,分别是:Binary Relevance (BR)、Classifier Chains (CC)、Label Powerset (LP),下篇聚焦利用序列生成解决多标签分类方法,将使用Transformer完成该任务。本文共分为5节,第一节介绍实验数据来源、任务说明;第二节介绍BR、CC、LP各自原理以及优缺点;第三节介绍本文使用的多标签分类评估标准原创 2024-01-10 19:49:01 · 1819 阅读 · 4 评论 -
【NLP实战】基于Bert和双向LSTM的情感分类【中篇】
本文为该系列第二篇文章,在本文中,我们将学习如何用pytorch搭建我们需要的Bert+Bilstm神经网络,如何用pytorch lightning改造我们的trainer,并开始在GPU环境我们第一次正式的训练。在这篇文章的末尾,我们的模型在测试集上的表现将达到排行榜28名的位置。原创 2023-04-10 16:53:23 · 6706 阅读 · 32 评论 -
【NLP实战】基于Bert和双向LSTM的情感分类【上篇】
最近自己找了个实验做,写了很多实验记录和方法,现在我将它们整理成文章,希望能对不熟悉NLP的伙伴们起到些许帮助。如有疑问请及时联系作者。issey的博客 - 愿无岁月可回首本系列文章中不会说明环境和包如何安装,这些应该是最基础的东西,可以自己边查边安装。许多函数用法等在代码里有详细解释,但还是希望各位去看它们的官方文档,我的代码还有很多可以改进的方法,需要的函数等在官方文档都有说明。本系列将带领大家从数据获取、数据清洗、模型构建、训练,观察loss变化,调整超参数再次训练,并最后进行评估整一个过程。原创 2023-04-10 14:33:41 · 5466 阅读 · 6 评论 -
【NLP实战】基于Bert和双向LSTM的情感分类【下篇】
本文为该系列第三篇文章,也是最后一篇。本文共分为两部分,在第一部分,我们将学习如何使用pytorch lightning保存模型的机制、如何读取模型与对测试集做测试。第二部分,我们将探讨前文遇到的过拟合问题,调整我们的超参数,进行第二轮训练,并对比两次训练的区别。我们还将基于pytorch lightning实现回调函数,保存训练过程中val_loss最小的模型。最后,将我们第二轮训练的best model进行评估,这一次,模型在测试集上的表现将达到排行榜第13位。原创 2023-04-11 00:28:19 · 3617 阅读 · 20 评论