探索雅意信息抽取统一大模型 (YAYI-UIE)：开启信息抽取新纪元

最新推荐文章于 2024-08-25 08:45:08 发布

郝钰程Kacey

最新推荐文章于 2024-08-25 08:45:08 发布

阅读量288

点赞数 3

本文链接：https://blog.csdn.net/gitblog_00611/article/details/141294819

版权

探索雅意信息抽取统一大模型 (YAYI-UIE)：开启信息抽取新纪元

YAYI-UIE雅意信息抽取大模型：在百万级人工构造的高质量信息抽取数据上进行指令微调，由中科闻歌算法团队研发。 (Repo for YAYI Unified Information Extraction Model)项目地址:https://gitcode.com/gh_mirrors/ya/YAYI-UIE

项目介绍

雅意信息抽取统一大模型 (YAYI-UIE) 是一个在百万级高质量信息抽取数据上进行指令微调的先进模型。它统一训练了包括命名实体识别（NER）、关系抽取（RE）和事件抽取（EE）在内的多种信息抽取任务。YAYI-UIE 不仅在通用场景下表现卓越，还在金融、生物、医疗、商业等多个专业领域展现出强大的结构化抽取能力。

通过开源 YAYI-UIE，我们旨在推动中文预训练大模型开源社区的发展，并与全球合作伙伴共同构建雅意大模型生态。更多技术细节将在我们的技术报告中详细阐述。

项目技术分析

YAYI-UIE 基于 Baichuan2-13B 进行指令微调，利用了 Microsoft 的 DeepSpeed 分布式训练工具，以及 Huggingface 的 transformers 库。模型在多种语言和领域数据上进行了广泛的训练，确保了其在不同场景下的高效和准确性。

项目及技术应用场景

YAYI-UIE 的应用场景广泛，包括但不限于：

金融分析：自动抽取和分析金融新闻中的关键信息，如股票变动、公司重组等。
生物医学研究：从科学文献中抽取生物医学相关的实体和事件，加速研究进程。
法律文书处理：自动识别法律文档中的关键实体和关系，提高法律工作的效率。
新闻编辑：辅助编辑快速识别新闻文本中的关键信息，提升内容生产的速度和质量。

项目特点

多语言支持：YAYI-UIE 支持中文和英文，覆盖多种语言环境。
多领域适应性：模型在多个领域进行了专门的训练，能够适应不同行业的特定需求。
高性能：在多个公开数据集上，YAYI-UIE 的性能超过了同类模型，特别是在中文数据集上表现突出。
易于使用：模型已在 Huggingface 上开源，提供了详细的安装和使用指南，便于开发者快速上手。

YAYI-UIE 不仅是一个技术上的突破，更是一个推动信息抽取技术向前发展的强大工具。我们期待您的加入，一起探索和应用这一创新技术，开启信息抽取的新篇章。

郝钰程Kacey

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
探索雅意信息抽取统一大模型 (YAYI-UIE)：开启信息抽取新纪元

探索雅意信息抽取统一大模型 (YAYI-UIE)：开启信息抽取新纪元 YAYI-UIE雅意信息抽取大模型：在百万级人工构造的高质量信息抽取数据上进行指令微调，由中科闻歌算法团队研发。 (Repo for YAYI Unified Information Extraction Model)项目地址:https://gitcode.com/gh_mirrors/ya/YAYI-UIE 项目介绍雅意...
复制链接

扫一扫