bert做文本摘要_Keras 教程：BERT 文本摘要

最新推荐文章于 2024-06-23 09:36:48 发布

weixin_39743414

最新推荐文章于 2024-06-23 09:36:48 发布

阅读量235

点赞数

文章标签： bert做文本摘要

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39743414/article/details/111487741

版权

该教程介绍了如何利用Keras和BERT模型进行文本摘要，通过微调BERT，计算每个token作为答案开始和结束的概率，以实现文本提取。在SQuAD数据集上进行训练和评估，展示了一种有效的自然语言处理方法。

摘要由CSDN通过智能技术生成

字幕组双语原文：Keras 教程：BERT 文本摘要

英语原文：BERT (from HuggingFace Transformers) for Text Extraction

翻译：雷锋字幕组(yhfwww、wiige)

介绍

这个演示使用了SQuAD (Stanford question - answer Dataset)。在SQuAD 数据集中，输入由一个问题和一个上下文段落组成。目标是找到回答问题的段落的跨度。我们使用“精确匹配(Exact Match)”指标来评估我们在这些数据上的表现，它度量了精确匹配任何一个真实答案的预测的百分比。

我们对一个BERT模型进行微调，如下所示:将上下文和问题作为输入，输入给BERT。

取两个向量S和T它们的维数等于BERT中隐藏状态的维数。

计算每个token作为答案范围的开始和结束的概率。一个token作为答案开始的概率是由S和在最后一层BERT中表示的token之间的点积给出的，然后是所有token的softmax。token作为最终答案的概率的计算方法与向量T类似。

微调BERT，学习S和T。

参考:

BERT

SQuAD

设置:

设置BERT分词器

载入数据

数据预处理遍历JSON文件,把每行记录都保存为SquadExample对象.

遍历每个SquadExample对象来创建x_train, y_train, x_eval, y_eval.

用BERT和函数式API来构建问答模块

这段代码很适合用Google Colab TPU来跑. 用Colab TPUs, 每个epoch大概花5-6分钟即可.构建评价回调函数

这个回调函数会在每个epoch后用验证集数据计算匹配值.

训练和评估

雷锋字幕组是一个由 AI 爱好者组成的翻译团队，汇聚五百多位志愿者的力量，分享最新的海外AI资讯，交流关于人工智能技术领域的行业变革与技术创新的见解。

团队成员有大数据专家、算法工程师、图像处理工程师、产品经理、产品运营、IT咨询人、在校师生；志愿者们来自IBM、AVL、Adobe、阿里、百度等知名企业，北大、清华、港大、中科院、南卡罗莱纳大学、早稻田大学等海内外高校研究所。

如果，你也是位热爱分享的AI爱好者。欢迎与雷锋字幕组一起，学习新知，分享成长。

雷锋网雷锋网

weixin_39743414

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
bert做文本摘要_Keras 教程：BERT 文本摘要

字幕组双语原文：Keras 教程：BERT 文本摘要英语原文：BERT (from HuggingFace Transformers) for Text Extraction翻译：雷锋字幕组(yhfwww、wiige)介绍这个演示使用了SQuAD (Stanford question - answer Dataset)。在SQuAD 数据集中，输入由一个问题和一个上下文段落组成。目标是找到回答问题...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。