大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。
本文主要介绍了试题标签预测方案总结,希望能对同学们有所帮助。
1. 方案一
1.1 算法方案解析
1.1.1 赛题分析
- 根据试题类型,内容,选项,分析等变量来预测试题难度和知识点
- 各级知识点之间有联系
- 训练集15080,测试集4698
- 评测指标:q_level和KnowledgeID的microF1值的平均
1.1.2 模型框架
- type,content, options用[NEW SEP]拼接为text1,Analysis作为text2
- [CLS]text1[SEP]text2[SEP]作为BERT的输入
- 下游接6个target的分类任务