kaggle数据集汇总_NLP常用模型和数据集高速下载

PS. 本文Markdown导入的,知乎好像对表格支持不好,建议直接阅读原文

http://pddj99.coding-pages.com/post/28052.html​pddj99.coding-pages.com

楔子

由于大部分NLP的模型和数据集都在国外,导致国内下载速度实在感人 。好在有很多NLP的框架内置了很多数据集,都是国内链接,亲测下载速度很快,本文汇总一下一些我见到的国内链接,文末感谢这些平台提供的存储和下载服务。

正文

模型

| 模型 | 文件名称 | 下载链接 | | :--: | :----------------------: | :----------------------------------------------------------: | | | bert-base-cased | 下载 | | | bert-base-chinese | 下载 | | | bert-base-uncased | 下载 | | | bert-chinese-wwm-ext | 下载 | | BERT | bert-chinese-wwm | 下载 | | | bert-large-cased-wwm | 下载 | | | bert-large-cased | 下载 | | | bert-large-uncased-wwm | 下载 | | | bert-large-uncased | 下载 |

数据集

| 数据集 | 文件名称 | 下载链接 | | :------------------------: | :------------: | :----------------------------------------------------------: | | 中文情感分析 | ChnSentiCorp | 下载 | | 语义相似度 | LCQMC | 下载 | | 问答匹配 | NLPCC_DPQA | 下载 | | 中文命名实体识别 | MSRA_NER | 下载 | | 英文多标签分类数据集 | Toxic | 下载 | | 抽取式英文阅读理解 | SQUAD | 下载 | | 抽取式中文阅读理解 | CMRC2018 | 下载 | | 抽取式繁体阅读理解 | DRCD | 下载 | | 英文数据集集合 | GLUE | 下载 | | 跨语言自然语言推理 | XNLI | 下载 | | 今日头条中文新闻短文本分类 | TNews | 下载 | | 互联网情感分析 | INews | 下载 | | 智能客服中文问句匹配 | BQ | 下载 | | 中文长文本分类 | IFLYTEK | 下载 | | 中文长文本分类 | THUCNEWS | 下载 |

词向量

| 词向量 | 文件名称 | 下载链接 | | :----: | :---------------: | :--------------------------------------------------: | | | glove.6B.50d | 下载 | | | glove.6B.100d | 下载 | | GloVe | glove.6B.200d | 下载 | | | glove.6B.300d | 下载 | | | glove.42B.300d | 下载 | | | glove.840B.300d | 下载 |

感谢

  • fastnlp提供的模型和词向量,more
  • paddlehub提供的数据集, more

Tips

如果还有其他的国外文件需要下载,国内下载很慢,可以尝试使用kaggle的notebook先下载到kaggle,然后再下载到本地,亲测有效 。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值