文本相似度比赛baseline
比赛地址:https://tianchi.aliyun.com/competition/entrance/231776/information
训练集共包括8753对数据,共八种类别:'哮喘', '咳血', '支原体肺炎', '肺气肿', '肺炎', '上呼吸道感染', '胸膜炎', '感冒'。比赛任务是进行细粒度的文本匹配(具体见官网),数据大致如下:
首先简单观察一下数据,检查NAN值...
原创
2020-02-25 19:05:44 ·
957 阅读 ·
0 评论