导读
论文 CSL: A Large-scale Chinese Scientific Literature Dataset 发表在自然语言处理顶会COLING2022上,该工作提出了首个中文科学文献数据集-CSL,包含约40万条中文论文,具有广泛的领域分类和细粒度学科标签,能用于构建多种NLP任务,例如文本摘要、关键词生成和文本分类等。
论文 CSL: A Large-scale Chinese Scientific Literature Dataset 发表在自然语言处理顶会COLING2022上,该工作提出了首个中文科学文献数据集-CSL,包含约40万条中文论文,具有广泛的领域分类和细粒度学科标签,能用于构建多种NLP任务,例如文本摘要、关键词生成和文本分类等。