开箱即用的百度开放域信息抽取的统一框架UIE

最新推荐文章于 2025-03-03 10:35:54 发布

weixin_42001089

最新推荐文章于 2025-03-03 10:35:54 发布

阅读量3.9k

点赞数 2

文章标签：深度学习自然语言处理机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42001089/article/details/124843130

版权

前言

在日常工作中，从文本中抽取各类信息是常见的基本任务，今天要给大家介绍的是百度开源的UIE框架，这一框架在实体抽取、关系抽取、事件抽取、情感分析等任务上都有着良好的泛化效果。其在医疗、金融等领域都有着不错的效果。

而且最重要的是其可以实现零样本（zero-shot）或者少样本（few-shot）抽取，达到了开箱即用的效果。

医疗领域效果：

金融领域效果：

框架地址：

https://github.com/PaddlePaddle/PaddleNLP/tree/develop/model_zoo/uiegithub.com

怎么开始

这里就不多介绍了，其官方文档中都有demo，如：

笔者自己也试了一下：

更多用法大家可以自己试试，这里需要说的是整个框架是以ERNIE（百度的一个预训练模型）为backbone，基于prompt思想设计的，这里的prompt其实就是代码中的schema，可以看得出怎么设计prompt模版成为了最关键的点，而UIE把怎么设计模版这个问题下放给了用户，这样就满足了用户形形色色的需求。

作为用户，我们在使用的时候最应该关注点就是怎么设计自己的prompt模版，这里笔者也试了一下，通常来说prompt模版提示词最好在原文出现，不出现比较难抽取出来，当然了一些通用抽取类型比如“时间，地点，机构”啥的直接裸写就可以。

总结

其实不论是NLP亦或是CV等领域，模型、任务统一都是个趋势，Bert等预训练模型的出现其实相比以前就在一定程度上统一了一波，将来还会更统一，其实从最高的理想状态来说最好就一个大一统模型，它什么都可以完成，其不仅仅能完成一个模态中的各类任务，而且还能处理各种模态任务，哈哈，这个理想也许很远，但是确实一直在前进。

关注

欢迎关注，下期再见啦~

欢迎关注笔者微信公众号：

github:

Mryangkaitong · GitHubhttps://github.com/Mryangkaitong

知乎：

小小梦想 - 知乎

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。