《面向中文医疗事件的联合抽取方法》CSCD

最新推荐文章于 2024-07-23 14:02:50 发布

laughterhxy

最新推荐文章于 2024-07-23 14:02:50 发布

阅读量608

点赞数

文章标签：自然语言处理深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/laughterhxy/article/details/122099313

版权

本文对肿瘤数据进行信息抽取，包括肿瘤原发部位和原发肿瘤大小的联合抽取（因为二者是存在关联的所以可以采用联合抽取），肿瘤转移部位的抽取。

肿瘤原发部位（实体抽取） BILSTM-CRF
基于肿瘤大小的特殊结构（MM或CM结尾，还有*，x，X等符号）来获取候选词
基于候选词和肿瘤原发部位形成元组，计算得分最高的元组中的肿瘤大小作为原发肿瘤大小
肿瘤转移部位的抽取先筛选句子，使用CNN模型对句子进行分类，最后使用BILSTM-CRF做实体抽取

本文提出了一种基于关键信息全域随机替换的伪数据生成算法，对已标注的病历文本进行伪标注，获取伪标注数据，实现标注病历文本数量和类型的扩充。

总结：本文是做数据抽取的，对于独立数据进行了BILSTM-CRF抽取，有关联的数据采用了联合数据。在数据处理方面通过伪造数据来扩大数据集，节省人工成本，然后抽取肿瘤转移部位的时候是先抽取文本中的相关句子然后再对其进行抽取，把无关数据进行剔除，降低噪音。本文是在比赛中取得了第三名，与前两名的区别主要是前两名使用了预训练的BERT层，使用之后能够提高模型效果但是性能会降低。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
《面向中文医疗事件的联合抽取方法》CSCD

本文对肿瘤数据进行信息抽取，包括肿瘤原发部位和原发肿瘤大小的联合抽取（因为二者是存在关联的所以可以采用联合抽取），肿瘤转移部位的抽取。肿瘤原发部位（实体抽取） BILSTM-CRF 基于肿瘤大小的特殊结构（MM或CM结尾，还有*，x，X等符号）来获取候选词基于候选词和肿瘤原发部位形成元组，计算得分最高的元组中的肿瘤大小作为原发肿瘤大小肿瘤转移部位的抽取先筛选句子，使用CNN模型对句子进行分类，最后使用BILSTM-CRF做实体抽取本文提出了一种基于关键信息全域随机替换的伪数据生...
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。