【多标签零样本主题推理】Zero-Shot Multi-Label Topic Inference with Sentence Encoders and LLMs

最新推荐文章于 2025-04-02 18:24:37 发布

Arachis_X

最新推荐文章于 2025-04-02 18:24:37 发布

阅读量340

点赞数 3

分类专栏： nlp 文章标签： chatgpt 人工智能 nlp

本文链接：https://blog.csdn.net/Arachis_X/article/details/137157234

版权

nlp 专栏收录该内容

24 篇文章

订阅专栏

Zero-Shot Multi-Label Topic Inference with Sentence Encoders and LLMs 利用句子编码器和 LLM 进行零样本多标签主题推理

EMNLP 2023 （2023.6.23截稿/2023.12.6开会）

论文地址
 代码暂无
在这里插入图片描述

在这里插入图片描述

Abstract

In this paper, we conducted a comprehensive study with the latest Sentence Encoders and Large Language Models (LLMs) on the challenging task of “definition-wild zero-shot topic inference”, where users define or provide the topics of interest in real-time. Through extensive experimentation on seven diverse data sets, we observed that LLMs, such as ChatGPT-3.5 and PaLM, demonstrated superior generality compared to other LLMs, e.g., BLOOM and GPT-NeoX. Furthermore, Sentence-BERT, a BERT-based classical sentence encoder, outperformed PaLM and achieved performance comparable to ChatGPT-3.5.

在本文中，我们利用最新的句子编码器和大型语言模型（LLM）对 "definition-wild zero-shot主题推理 "这一具有挑战性的任务进行了全面研究。

通过在七个不同的数据集上进行广泛实验，我们发现，与其他 LLM（如 BLOOM 和 GPT-NeoX）相比，ChatGPT-3.5 和 PaLM 等 LLM 表现出更优越的通用性。

此外，基于 BERT 的经典句子编码器 Sentence-BERT 的表现优于 PaLM，其性能可与 ChatGPT-3.5 相媲美。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Arachis_X

关注关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

将专家混合推向极限：参数效率极高的 MoE 指令调节

强化学习曾小健

07-08

1435

专家混合 (MoE) 是一种众所周知的神经架构，其中一组专门的子模型以恒定的计算成本优化整体性能。然而，由于需要将所有专家存储在内存中，传统的 MoE 带来了大规模的挑战。在本文中，我们将 MoE 推向了极限。我们通过独特地将 MoE 架构与轻量级专家相结合，提出了参数效率极高的 MoE。我们的 MoE 架构优于标准参数高效微调 (PEFT) 方法，并且仅通过更新轻量级专家即可与完全微调相媲美 - 少于 1% 11B 参数模型的百分比。此外，我们的方法可以推广到看不见的任务。

视觉-语言模型零样本推理方法

python_plus的博客

06-12

1467

介绍了CVPR2024论文《Learning by Correction: Efficient Tuning Task for Zero-Shot Generative Vision-Language Reasoning》

参与评论您还未登录，请先登录后发表或查看评论

《预训练周刊》第48期：零样本推理、模型模板生成、去噪解码器

BAAIBeijing的博客

06-09

509

No.48智源社区预训练组预训练研究观点资源活动周刊订阅告诉大家一个好消息，《预训练周刊》已经开启“订阅功能”，以后我们会向您自动推送最新版的《预训练周刊》。订阅方法：方式1：扫描下面二维码，进入《预训练周刊》主页，选择“关注TA”。方式2：点击本文下方的“阅读原文”，进入《预训练周刊》Hub社区版，根据内附的详细订阅步骤，完成订阅。关于周刊本期周刊，我们选择了11篇预训...

开启零样本推理新纪元：《大型语言模型作为零样本推理者》项目推荐

gitblog_00089的博客

06-10

535

开启零样本推理新纪元：《大型语言模型作为零样本推理者》项目推荐去发现同类优质开源项目:https://gitcode.com/ 在人工智能的浩瀚星空中，一款引人注目的开源项目闪耀登场——《大型语言模型作为零样本推理者》，该成果荣登NeurIPS 2022，标志着我们在理解与应用大型语言模型方面的重大突破。本文旨在揭秘这一项目，带领大家探索其背后的奥秘，以及如何利用这一工具解锁新的研究和应用领域。...

计划和解决提示：通过大型语言模型改进零样本思维链推理12.9

RM_Jin的博客

12-09

1254

最近，大型语言模型 (LLM) 已被证明可以在各种 NLP 任务中提供令人印象深刻的性能。为了解决多步骤推理任务，少镜头思维链（CoT）提示包括一些手动制作的逐步推理演示，使法学硕士能够显式生成推理步骤并提高推理任务的准确性。为了消除手动工作，Zeroshot-CoT 将目标问题陈述与“让我们一步一步思考”连接起来，作为法学硕士的输入提示。尽管 Zero-shot-CoT 取得了成功，但它仍然存在三个缺陷：计算错误、失步错误和语义误解错误。

零样本学习：真的不需要一个样本吗？

qlkaicx的博客

06-01

1673

零样本学习在推理阶段确实可以不依赖于新类别的标注样本，但它依赖于丰富的辅助信息和已知类别的样本来进行训练。通过利用这些辅助信息，零样本学习能够在新类别没有标注样本的情况下，实现准确的识别和分类。零样本学习为解决数据稀缺问题提供了一种有效的方法，在许多实际应用中具有广泛的应用前景。理解并掌握零样本学习的原理和方法，将有助于应对数据稀缺带来的挑战，提升机器学习模型的性能和应用范围。

Unifying Large Language Models and Knowledge Graphs: A Roadmap综述笔记-入门-知识图谱KG-大模型LLM

好好学习|学无止境

11-26

1985

LLMs，例如chatGPT和GPT4，由于其涌现能力和泛化性，对自然语言理解和人工智能领域产生了新的冲击。然而，LLMs是一个黑箱模型，往往缺乏捕获和获得事实知识。相反，知识图谱，例如维基百科等，是有结构模型。存储着丰富的事实知识。KGs可以通过提供额外的知识去增强大语言模型的推理和解释性。同时，知识图谱也很难去自然构造和进化，对于现有的知识图谱方法来说，生成新的事实和表示未知数据是一个挑战。因此，统一LLMs和KG，同时利用他们的优点是一种补充。在这篇文章中，我们提出了统一LLMs和KG的路线图。

零样本学习简单介绍

百年孤独百年的博客

05-22

1881

零样本学习（Zero-Shot Learning，ZSL）是一种机器学习技术，旨在让模型在没有见过某些类别的情况下进行分类。在传统的监督学习中，模型只能分类它在训练集中见过的类别。但是，在现实世界中，我们可能会遇到未知的类别，这时候传统的监督学习方法就无法适用了。这时候，零样本学习就可以派上用场。

现代NLP中的零样本学习

AI公园

06-09

1560

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”作者：Joe Davison编译：ronghuaiyang导读使用最新的NLP技术来进行零样本学习的一些进展和工作。自然语言处理...

【ISWC2021】当知识图谱遇上零样本视觉问答

zenRRan的博客

08-04

486

点击下面卡片，关注我呀，每天给你送来AI技术干货！论文题目：Zero-shot Visual Question Answering using Knowledge Graph本文作者：陈卓...

零样本学习公开代码整理-转载

baidu_40840693的博客

04-02

1128

《Zero-Shot Learning Through Cross-Modal Transfer》 http://takecareofbigboss.github.io/2015/05/01/post/ caffe开源： https://github.com/pedro-morgado/score-zeroshot https://github.com/pujols/zero-shot-l...

人工智能在生物医药-新版ChatGPT-4o辅助一键生成机制图

itwangyang520的博客

04-01

1203

细胞侵袭（Transwell invasion assay）、迁移（Wound healing assay, Transwell migration assay）以及动物模型中的转移灶形成（肺转移模型、肝转移模型等）是肿瘤研究中成熟且可量化的表型指标。乳酸化作为高乳酸的下游事件，其促进的功能很可能就体现在侵袭和转移能力的增强上。乳酸化修饰、ccRCC、预测靶标（KDM5C/SNAI1/YAP1）、预测通路（Hippo/YAP1）、预测表型（转移/侵袭/迁移）转移是导致ccRCC患者死亡的主要原因。

ChatGPT 的新图像生成器非常擅长伪造收据

网络研究观

04-01

351

不难想象，这种技术会被不法分子用来“报销”完全虚假的费用。

基于DeepSeek、ChatGPT支持下的地质灾害风险评估、易发性分析、信息化建库及灾后重建

最新发布

glldxh的博客

04-02

538

大模型（Large Language Model, LLM）是一种基于深度学习技术的大规模自然语言处理模型。

【Deepseek、ChatGPT】智能气候前沿：AI Agent结合机器学习与深度学习在全球气候变化驱动因素预测中的应用

JNLWLAQ的博客

04-01

1093

【Deepseek、ChatGPT】智能气候前沿：AI Agent结合机器学习与深度学习在全球气候变化驱动因素预测中的应用

从ChatGPT到AutoGPT——AI Agent的范式迁移

互联网架构师笔记

03-29

569

AutoGPT 代表了 AI Agent 的最新发展趋势，极大地提升了 AI 在自主任务执行方面的能力。然而，技术成熟度、伦理问题和商业化落地仍然是当前需要解决的关键挑战。未来，随着 AutoGPT 和其他 AI Agent 的不断演进，我们有望见证 AI 在生产力提升和企业运营中的更大突破。

深入了解ChatGPT之类的大语言模型笔记

RockTec的专栏

03-29

889

本篇是 Andrej Karpathy 的演讲 “Deep Dive into LLMs like ChatGPT” 的笔记。Andrej Karpathy 是一位在机器学习和人工智能领域，尤其是深度学习和计算机视觉方面非常知名的专家。他曾在斯坦福大学获得博士学位，在那里他的研究工作集中在开发用于理解视觉世界的深度神经网络。Karpathy 还是 ConvNetJS 的创建者，这是一个用于浏览器中进行深度学习的库。

YO-CSA-T：基于上下文与空间注意力的实时羽毛球轨迹追踪系统解析

hasakie的博客

03-31

923

本文围绕羽毛球轨迹实时追踪问题展开，提出了一种基于改进YOLOv8的检测网络（YO-CSA）和集成多模块的3D轨迹追踪系统。全文结构如下：摘要提出YO-CSA检测网络，结合上下文与空间注意力机制提升检测精度（mAP@0.75达90.43%）。构建实时3D轨迹追踪系统，集成检测、预测、补偿模块，帧率超130fps。引言背景：羽毛球高速飞行、易与环境混淆，传统检测方法精度不足。挑战：实时性、3D轨迹重建、遮挡补偿。贡献：轻量化检测网络、多维度时空约束策略、完整系统设计。相关工作。

Zero - shot

12-29

### Zero-Shot 学习概述 Zero-shot learning (ZSL) 是机器学习领域的一个分支，旨在使模型能够在没有见过的目标类别上执行预测任务。这一概念的核心在于利用预先获取的知识来推断未知类别的特征[^1]。 #### Embarrassingly Simple Approach to Zero-Shot Learning (ESZSL) 一篇重要论文提出了名为 "Embarrassingly simple Zero-Shot Learning" 的方法，简称 EsZSL。该研究指出这种方法极其简单，仅需少量代码即可实现，并且在多个标准数据集上的性能超过了当时的先进水平[^3]。具体来说： - **核心思想**：通过映射已知类别的语义表示到视觉空间中的分布来进行跨模态迁移。 - **实施简便性**：作者强调其方案易于理解和部署，甚至可以用单行代码完成主要逻辑操作。 - **优越效果**：实验结果显示，在不同类型的测试集中均取得了良好的识别精度提升。 #### 技术细节与应用案例为了更好地理解如何构建这样的系统，可以考虑以下几个方面： - **预训练阶段**：收集大量标注过的图像作为基础训练素材；同时准备描述这些对象的文字说明或其他形式的语言表达方式。 - **关联建模**：建立从文本描述向量转换成对应图片特征的空间变换机制，使得即使对于未曾遇到的新种类也能找到合理的匹配关系。 - **评估指标**：采用准确率、召回率等常见统计学度量工具衡量系统的有效性。 ```python import numpy as np from sklearn.preprocessing import LabelEncoder, OneHotEncoder def eszsl_classifier(train_features, train_labels, test_features): """ A simplified implementation of the ESZSL classifier. Parameters: train_features : array-like of shape (n_samples_train, n_features) Training set features extracted from images or other sources. train_labels : list of str Corresponding labels for each sample in `train_features`. test_features : array-like of shape (n_samples_test, n_features) Test set features that need classification without direct label information. Returns: predicted_classes : ndarray of int Predicted class indices for samples in `test_features`. """ # Encode string labels into integers le = LabelEncoder() encoded_labels = le.fit_transform(train_labels).reshape(-1, 1) ohe = OneHotEncoder(sparse=False) one_hot_encoded = ohe.fit_transform(encoded_labels) # Compute mean feature vectors per category during training phase means_per_class = [] unique_categories = np.unique(encoded_labels) for cat in unique_categories: mask = encoded_labels.flatten() == cat avg_vec = np.mean(train_features[mask], axis=0) means_per_class.append(avg_vec) # During inference time, assign new instances based on closest match with learned prototypes distances_to_prototypes = cdist(test_features, means_per_class, metric='euclidean') min_distance_indices = np.argmin(distances_to_prototypes, axis=1) return le.inverse_transform(unique_categories[min_distance_indices]) ```

【多标签 零样本 主题推理 】Zero-Shot Multi-Label Topic Inference with Sentence Encoders and LLMs

Zero-Shot Multi-Label Topic Inference with Sentence Encoders and LLMs 利用句子编码器和 LLM 进行零样本多标签主题推理

EMNLP 2023 （2023.6.23截稿/2023.12.6开会）

Abstract

【多标签零样本主题推理】Zero-Shot Multi-Label Topic Inference with Sentence Encoders and LLMs