机器读中文2:“辨古识今”
比赛概述
本比赛为个人练习赛,主要针对于数据新人、尤其中文文本处理方面的新手进行自我练习、自我提高,与大家切磋。
练习赛时限:2017-11-01 至 2019-11-01
任务类型:自然语言处理、二元分类
背景介绍:
本次练习赛是“机器读中文”系列的第二期(第一期为机器读中文:根据名字判断性别)。
自然语言处理是机器学习中的一个重要方向,但是现在流行的学习资料和网上的数据集都是以英文为主。SofaSofa旨在推动初学者对中文自然语言处理的学习热情以及能力掌握。
每次练习赛任务是做一次简单的“辨古识今”———二元分类。对于给定的一句话或者片段,选手来判定这句话是文言文还是白话文。
比赛链接
这里