利用用户医疗文本挖掘用户个人疾病相关的事件,这个系统,流水线模式:
1,时间提取 -》 event extraction
2,时间线结构生成 -》 temporal tagger and resolver
首先是基于term的相关文本探测和过滤,然后根据相关文本对term进行优化(互相吸收过滤),最后进行聚类(用到lda,word2vec)等方法;然后是时序的生成,采用了时序表达的方法(基于规则的方法)。
总结,这篇论文领域不太相同,不好评论,不过方法类似jiewei li的方法,但是研究单个用户的内容,相当于任务更偏向应用,最后,因为用户文本的内容相关性更集中,所以处理更简单。