背景
突发事件一般指对社会造成或可能会造成比较严重的危害,需要人们采取应急管理措施从而应对的公共卫生事件、事故灾难事件、自然灾害事件和社会安全事件。伴随着社交媒体的快速发展,互联网上突发事件的相关信息也急剧增多。从篇章级的新闻报道中准确识别突发事件之间的因果和时序关系,有助于分析事件的演化和发展脉络,从而对突发事件进行及时的态势研判,对于国家和社会安全具有十分重要的意义。
面向篇章级文本的突发事件关系抽取任务面临的挑战主要体现在以下几个方面:首先,篇章级文本通常涉及复杂的句法结构和丰富的语义信息,事件之间的关系可能跨越多个句子甚至段落,这就要求模型能够理解并处理长距离的依赖关系。其次,因果和时序关系的表达方式多样化,同一种关系可能通过不同词汇、句式或隐含的语境来表达,这就需要模型具备较强的推理来识别这些多样化表达。目前,事件因果关系研究大多将因果事件限定为一对一的关系,而在突发事件文本中,往往会包含多对因果事件,较为复杂的篇章还包含嵌套因果事件。因此,尽管这项任务具有重要的应用价值,但要实现高效准确的关系抽取,仍需克服上述挑战。
中国科学院信息工程研究所在CCKS2024大会组织本次评测任务。本次评测将依托阿里云天池平台展开。
比赛地址:https://tianchi.aliyun.com/competition/entrance/532189
参赛人:Fan
方法
1. 使用Qwen2-72b Instruct进行lora微调,学习率设为2e-4
2.同样选择Qwen2-72b-Instruct,设置不同的学习率训练额外三个模型,同时在预测阶段设置不同的生成参数,生成40份结果B
3. Qwen2-72b-Instruct、Qwen2-7b-Instruct、Baichuan2-13b-chat三个模型,训练事件关系分类器4. 将结果A与40份结果B进行集成,并用分类器进行筛选。
qwen2-72b-instruct 学习率1e-5 checkpoint225: 生成参数:
temperature=0.7, top_p=0.7, beam_search=1
temperature=0.7, top_p=0.5, beam_search=1
temperature=0.7, top_p=0.48, beam_search=1
temperature=0.71, top_p=0.5, beam_search=1
temperature=0.8, top_p=0.5, beam_search=1
temperature=0.68, top_p=0.5, beam_search=1
temperature=0.78, top_p=0.6, beam_search=1
temperature=0.72, top_p=0.52, beam_search=1
temperature=0.75, top_p=0.75, beam_search=1
temperature=0.78, top_p=0.7, beam_search=1
qwen2-72b-instruct 学习率1e-5 checkpoint225: 生成参数:
temperature=0.7, top_p=0.5, beam_search=1
temperature=0.72, top_p=0.52, beam_search=1
temperature=0.71, top_p=0.5, beam_search=1
temperature=0.7, top_p=0.48, beam_search=1
temperature=0.7, top_p=0.7, beam_search=1
temperature=0.8, top_p=0.5, beam_search=1
temperature=0.78, top_p=0.6, beam_search=1
temperature=0.75, top_p=0.75, beam_search=1
temperature=0.78, top_p=0.7, beam_search=1
temperature=0.68, top_p=0.5, beam_search=1
qwen2-72b-instruct 学习5e-5 checkpoint250: 生成参数:
temperature=0.78, top_p=0.7, beam_search=1
temperature=0.7, top_p=0.5, beam_search=1
temperature=0.75, top_p=0.75, beam_search=1
temperature=0.7, top_p=0.48, beam_search=1
temperature=0.78, top_p=0.6, beam_search=1
temperature=0.68, top_p=0.5, beam_search=1
temperature=0.71, top_p=0.5, beam_search=1
temperature=0.8, top_p=0.5, beam_search=1
temperature=0.7, top_p=0.7, beam_search=1
temperature=0.72, top_p=0.52, beam_search=1
qwen2-72b-instruct 学习率3e-4 checkpoint250: 生成参数:
temperature=0.7, top_p=0.48, beam_search=1
temperature=0.71, top_p=0.5, beam_search=1
temperature=0.8, top_p=0.5, beam_search=1
temperature=0.72, top_p=0.52, beam_search=1
temperature=0.78, top_p=0.6, beam_search=1
temperature=0.75, top_p=0.75, beam_search=1
temperature=0.7, top_p=0.5, beam_search=1
temperature=0.7, top_p=0.7, beam_search=1
temperature=0.68, top_p=0.5, beam_search=1
temperature=0.78, top_p=0.7, beam_search=1
结果:
f1分数达到74.9646,排名第一
method | score |
sft_lora | 74.17 |
+vote | 74.96 |