DeepDDI不得不吐槽一下这篇论文排版实在是太难看了,所以我一直都没看,发现这里面有很多是我以前没有注意到的东西,说来也是我自己太菜了,搞DDI肯定是要针对数据集设计模型的,我每次都看模型怎么样,居然都没有重视到数据集的问题,太不应该了。
模型具体细节不必过于关注,是18年的老论文了,数据集倒是很少有描述得这么详细的,因为后面可能直接都是这样用的。
上图是附录里的部分
DrugBank里有192303个DDI,共99类, 类似于这种,在这99种DDI类型里,超过5个实例的有86种,所以就拿着86种来作为数据集,超过5(3:1:1)
一共有191878个药物对,192303个DDI,说明存在少部分药物对具有多种DDI,文中指出406个药物对存在多种DDI,大多数药物对是只有一种DDI关系的。192284个DDI只有一种关系,所以直接把192284个DDI作为标准数据及了.