COLING 2022 | CSL-大规模中文科学文献数据集

P01son

已于 2022-10-08 13:56:22 修改

阅读量6k

点赞数 3

文章标签：人工智能自然语言处理机器学习中文数据集论文数据

于 2022-10-01 15:44:36 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34832393/article/details/127134701

版权

提出CSL数据集，包含40万篇中文论文，涵盖广泛学科领域，适用于文本摘要、关键词生成等NLP任务。构建基准测评，促进中文科学文献处理技术发展。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

导读

论文 CSL: A Large-scale Chinese Scientific Literature Dataset 发表在自然语言处理顶会COLING2022上，该工作提出了首个中文科学文献数据集-CSL，包含约40万条中文论文，具有广泛的领域分类和细粒度学科标签，能用于构建多种NLP任务，例如文本摘要、关键词生成和文本分类等。

下载地址：GitHub - ydli-ai/CSL: [COLING 2022] CSL: A Large-scale Chinese Scientific Literature Dataset 中文科学文数据集[COLING 2022] CSL: A Large-scale Chinese Scientific Literature Dataset 中文科学文献数据集 - GitHub - ydli-ai

最低0.47元/天解锁文章

博客等级

码龄9年

18
原创

97
点赞

538
收藏

37
粉丝

关注

私信

热门文章

最新评论

快速使用 BERT 生成词向量：bert-as-service
蓦晓然: 博主你好，提取出来的词向量可以用来分类吗
快速使用 BERT 生成词向量：bert-as-service
weixin_47557385: bert是生成词向量吗？如果做句子情感分析还需要讲词向量拼接吗？还是bert可以直接做句子情感分析呢？是有监督还是无监督呢？
快速使用 BERT 生成词向量：bert-as-service
weixin_44811168: ['一斤'，'苹果']在bert看来是两个句子，bert输入的[cls]sentence[sep]。你要输入的是[‘一斤苹果’,‘苹果手机’]
快速使用 BERT 生成词向量：bert-as-service
墨路~~: 这里，怎么体现同义词词，在不同的上下文中有不同的含义，bert可以学习出不同的词向量呢？我尝试了一下，哈工大版的中文bert，发现encode时，输入['一斤'，‘苹果’]和[“苹果”,'手机']时，苹果的词向量都是相同的。感觉输出的词向量类似是静态的，并没有结合上下文。
快速使用 BERT 生成词向量：bert-as-service
l623504389: 你好请问你解决了吗？？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。