META分析:
Meta分析是针对某一科研问题,根据明确的搜索策略、选择筛选文献标准、采用严格的评价方法,对来源不同的研究成果进行收集、合并及定量统计分析的方法,最早出现于“循证医学”,现已广泛应用于农林生态,资源环境等方面。R语言拥有完整有效的数据处理、统计分析与保存机制,可以对数据直接进行分析和显示,命令格式简单、结果可读性强,包含众多针对Meta分析软件包,是进行Meta整合分析及评价的有效平台。
我们的任务:
输入:一段医学文本的摘要,输出:两个表格,一个固定数据表格,内容包括该医学实验中的一些固定的参数和其对应值,一个outcome数据表格,内容包括该文献摘要中提及的本文献的outcome,其对应的outcome measure以及对应的值。
分类和PICO数据集一致,结构为:
根据它论文中的demo,PICO里面的标注全是实体类型的标注:
这就导致了某些问题的产生:
PICO的问题
PICO的实体之间没有对应关系。换句话说,PICO是用来做医学文本识别的数据集,因此实体类之间的关系是不被考虑在内的。
但如果我们打算利用数据生成表格,就必须搞清楚哪些值之间是有关系的。比如某个outcome,他和某个iv-bin-abs对应,或者与某个iv-bin-percent对应,且这个数字或百分数在文中和outcome出现的相对位置是不固定的,我们需要让模型能够找出他们的关系。
因此我们需要实现对应关系的话,在数据集中就需要标注出两个实体的对应关系来。
更新数据标注方法
outcome变为event,cv-bin-percent,iv-cont-mean,cv-cont-mean,iv-cont-median,cv-cont-median,iv-cont-sd,cv-cont-sd作为其属性
我们可以把原有outcome实体删除,并作为一个事件,其对应的数据作为其下面的属性实体。
相当于在原有标注基础上把outcome变成一个事件,再把其对应的数据变成其属性即可。