背景
Clinical trials对于循证医学很重要,但比较多,本文帮助医生自动抽取重要信息。
方法
提供一个web端工具,论文里限制了文本的条件,如下:
• were written in English;
• were published in the core clinical journals (as
defined by PubMed) in 2009;
• had abstracts and full texts available in HTML
format;
• reported on RCTs on human subjects
这其实限制很大,也为抽取解析工具带来了巨大的方便,感觉不实用,很多papers不满足第三条。
解析文本后,进行预处理,详细的就不说了。然后对句子分类,缩小范围。接下来就是使用正则+模板的方式,果然有用就行。。。最后对结果再做个处理,topk,去冗余什么的。
结论
一些处理工作可以借鉴,但是整体来说论文没有什么创新性,可能追求实用性。论文里给的链接可以打开,但是没有账号密码,怎么使用?这就很尴尬,没法实验看看效果。没有提供源码,不可复现。就看个思路就行。