做一个有想法的AI | 用LaserTagger做NLP的文本复述任务

訢詡

于 2021-01-19 15:12:09 发布

阅读量964

点赞数

分类专栏：深度学习NLP方向文章标签： BERT 文本复述 NLP nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Andrwin/article/details/112834184

版权

本文介绍了如何利用LaserTagger进行文本复述任务，涉及项目代码下载、数据准备、环境配置、训练与评估。通过调整相关参数，可避免如GPT2在长文本生成中可能出现的问题，实现更智能的文本处理。

摘要由CSDN通过智能技术生成

上文提到GPT2的文本生成任务，确实比较智障，一到200多个字之后就只会阿巴阿巴阿巴

本文我们我们讨论一下比较冷门的文本复述任务，其实和语义相似度任务比较像，只不过一个是分类一个是生成但是对于基础的编码解码来说区别不大。

一、下载项目代码和准备数据

项目地址： https://github.com/Jeremiah0425/text_scalpel

预训练权重：百度网盘链接: https://pan.baidu.com/s/1yho8ihR9C6rBbY-IJjSagA 提取码: 2a97

LCQMC数据下载地址：百度网盘链接： https://pan.baidu.com/s/1T0-jUEz2gmu99j1aM7lyTg 提取码：ynt0

数据需要手动改一下，把tsv改成txt就行文件名就直接改成train.txt dev.txt test.txt

二、准备环境

conda 虚拟环境搭建起来，基本从项目的requirements.txt的里面安装就行

防止tensorflow-gpu有问题先用conda install tensorflow-gpu=1.15.0装

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
做一个有想法的AI | 用LaserTagger做NLP的文本复述任务

上文提到GPT2的文本生成任务，确实比较智障，一到200多个字之后就只会阿巴阿巴阿巴本文我们我们讨论一下比较冷门的文本复述任务，其实和语义相似度任务比较像，只不过一个是分类一个是生成但是对于基础的编码解码来说区别不大。一、下载项目代码和准备数据项目地址：https://github.com/Jeremiah0425/text_scalpel预训练权重：百度网盘链接:https://pan.baidu.com/s/1yho8ihR9C6rBbY-IJjSagA提取码: 2a97...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。