181个NLP教程合集,Colab一键直达,无需环境配置,此外还有481个文本数据集

梅宁航 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

学习NLP不用愁了。

算力、环境配置谷歌提供,Colab套件对NLP全场景支持。

有了算力,还差教程,现在NLP学习合集大全套来了。

超强NLP合集

网站名直译过来就是——超强NLP合集!

181个超全资源合集,各个类型全都有,总有一款适合你。

资源概览

资源怎么使用?

光说不练假把式,既然是资源,就是让人用的,满满干货,无套路。

使用资源只需要三步:

1、打开网站,选择、搜索自己感兴趣的内容,比如搜索NLP领域最火的BERT

网站地址见文末

2、可以按描述内容选择自己感兴趣的模型,打开最后一列的Colab链接

得益于谷歌的慷慨,无需担心环境配置,直接进去学习即可。

这里以第一个BERT搜索结果为例????。

Transfer Learning with BERT

3、在进入Colab之后,和本地notebook文件使用方法是一样的,检查好配置之后,就可以按照目录进行学习,实时交互反馈结果。

这也是这份合集的意义,不再是干巴巴的说教,而是图文并茂可运行的实例,练起来!

总有一款模型适合你

当然,BERT只是其中一种类型,如果还没看够,下面是我们梳理的一些分类,可供选用。

1、按所用模型分类,可分为ANN、AxCell、BERT、CNN、GPT-2、LSTM等;

2、按任务类型分类,可分为分类、对话系统、词嵌入、语言模型、机器翻译、问答系统、情感分析等;

3、按所用框架分类,可分为PyTorch、TensorFlow、Keras等。

基本上涵盖了现在NLP发展的全景,不论是框架还是模型、任务,你都能在这里找到适合自己学习的对象。

此外,你也可以为抗击疫情出份力。

COVID-19相关内容

可以BERT来了解疫情期间人们的情绪变化,内容丰富,目录清晰,上手即可操作。

比如说OpenAI刚更新的GPT模型,当然,受限于时间,现在只有GPT-2模型,但了解一下GPT本身也是好的。

GPT-2模型

其中有一位国人作者,15 亿参数 GPT2 中文预训练模型,可以对GPT2本身有直观了解。

并且和谷歌drive一起使用,数据集存放也非常方便,全部流程只需点击两次。

模型本身已经被训练完毕,只需要加载训练使用即可,就这么简单,适合想直接使用的研究。

神奇的小网站

在作者发布之后,Reddit一片感谢贴,毕竟这么简单无套路的资源合集,可以说很良心了。

讨论区图

而且这个搜集资源的小网站也是个好去处,481个数据集,从几M到上G,从CSV格式到JSON格式,应有尽有,可以马克一下作为资源站收藏。

数据集

还有,他们还开发了一款名为RABBIT的文本分类器,可以实时对媒体报道进行分类,帮助我们更好分辨媒体报道的倾向性。

文本分类器RABBIT

妈妈再也不用担心我被“FAKE NEWS”骗了。

⚠️使用教程和下载数据集都要大路畅通哟~

仅仅教程收藏是没用的,一定要自己上手试试哟~

参考链接:
https://www.reddit.com/r/MachineLearning/comments/gvsh51/p_181_nlp_colab_notebooks_found_here/
https://notebooks.quantumstat.com

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

如今高考,得语文者得天下。而语文学习不能一蹴而就,日积月累才是大方向。

这个暑假,全国第一位登上《百家讲坛》的中学语文名师,“线下一课难求”王翔老师首次推出音频课:《经典名句格言90讲》。

90节思维语文音频课
暑期限时折扣89元????

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值