论文笔记:ExaCT: automatic extraction of clinical trial characteristics from journal publications

背景

Clinical trials对于循证医学很重要,但比较多,本文帮助医生自动抽取重要信息。

方法

提供一个web端工具,论文里限制了文本的条件,如下:
• were written in English;
• were published in the core clinical journals (as
defined by PubMed) in 2009;
• had abstracts and full texts available in HTML
format;
• reported on RCTs on human subjects

这其实限制很大,也为抽取解析工具带来了巨大的方便,感觉不实用,很多papers不满足第三条。
解析文本后,进行预处理,详细的就不说了。然后对句子分类,缩小范围。接下来就是使用正则+模板的方式,果然有用就行。。。最后对结果再做个处理,topk,去冗余什么的。

结论

一些处理工作可以借鉴,但是整体来说论文没有什么创新性,可能追求实用性。论文里给的链接可以打开,但是没有账号密码,怎么使用?这就很尴尬,没法实验看看效果。没有提供源码,不可复现。就看个思路就行。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值