【资源整合帖】机器学习&深度学习,如何从入门到高手

用来收集各类资源,各大包括机器学习ML、深度学习DL、自然语言处理NLP、机器视觉等方向,更新ing~

课程资源

很多视频课程网易云课堂、腾讯课堂、MOOC等视频学习类网站都有资源,but,基本上B站上都有搬运工 ,有弹幕解释,有评论提供资料、作业、解析等,所以——B站大法好!

1.软件基础

视频教程:

书籍/文献教程:

工具使用手册:

2.数理基础

书籍/文献教程:

3.机器学习

视频教程:

书籍/文献教程:

4.深度学习

视频教程:

书籍/文献教程:

5.自然语言处理

NLP四大类任务:

  • 序列标注:中文分词,词性标注,命名实体识别,语义角色标注……
  • 分类任务:文本分类,情感计算……
  • 句子关系判断:Entailment,QA,语义改写,自然语言推理……
  • 生成式任务:机器翻译,文本摘要,写诗造句,看图说话……

视频教程:

  • CS224n 斯坦福深度自然语言处理:原名  Deep Learning for Natural Language Processing (深度自然语言处理),是全球 NLP 领域最受欢迎的课程之一,让你在了解丰富的深度自然语言处理应用案例的同时,学会在实践中搭建出最先进的自然语言处理模型。
  • 斯坦福大学CS224d课程的中文版内容笔记:由寒小阳和龙心尘翻译和整理,得到斯坦福大学课程@Richard Socher教授的授权翻译与发表
  • 牛津大学&DeepMind 自然语言处理
  • 哥伦比亚大学Michael Collins教授的nlp课程,这门课的好处就是讲解的非常简单,无痛苦入门,之前Coursera上开了这门课,相应的资源可以在知乎上搜一下,Michael教授的笔记如行云流水,不可多得
  • Stanford的DAN JURAFSKY 和Christopher Manning的NLP课程,该课程是对1的补充,内容涵盖的也更加丰富,Coursera上也开过,目前被清了,资源知乎内找找吧
  • Stanford的CS224N,同样是Stanford的NLP经典课程,这门课主要采用深度学习的视角进行。以上三门课,如果题主好好完成,做完作业,应该会有很多的收获。
  •  

书籍/文献教程:

  • 国际计算语言学协会(ACL,The Association for Computational Linguistics):ACL成立于1962年,是自然语言处理(NLP)领域影响力最大、最具活力的顶级国际学术组织。多查阅ACL论文,有助于了解更多更新的知识
  • 《Python自然语言处理》:从输入法联想提示(predictive text)、email过滤到自动文本汇总、机器翻译,大量的语言相关的技术都离不开自然语言处理的支持,而这本书提供了自然语言处理的入门指南。通过本书,你将学到如何编写能处理大量非结构化文本的Python程序。你可以访问具有丰富标注的、涵盖了语言学各种数据结构的数据集,而且你将学习分析书面文档的内容以及结构的主要算法
  • 《基于深度学习的自然语言处理》:本书系统阐述将深度学习技术应用于自然语言处理的方法和技术,深入浅出地介绍了深度学习的基本知识及各种常用的网络结构,并重点介绍了如何使用这些技术处理自然语言
  • 《NLP高效沟通》(趣味漫画图文版):国际上大量案例证明,从破解成功人士语言和思维模式入手的NLP,能够帮助人们改善沟通质量,拥有好的人际关系和成功的未来
  • 《自然语言处理入门》:这是一本把读者阅读体验放在首位的中文 NLP 图书,作者采用从问题到算法再到工程实现的写作思路,只允许必不可少的公式出现,降低了读者学习的门槛,通俗易懂、容易上手。是一本可以在地铁上也能学会 NLP 开发的图书

经验贴:

6.计算机视觉

视频教程:

书籍/文献教程:

 

7.语音识别

 

实战经验:

竞赛教程:

开放平台/开源模型

直接调用开放平台的API接口或SDK

谷歌最强 NLP 模型 BERT 

github项目地址https://github.com/google-research/bert

论文原文https://arxiv.org/pdf/1810.04805.pdf

百度AI开放平台

https://ai.baidu.com/

腾讯AI开放平台

https://ai.qq.com/

网易AI平台

http://openai.163.com/

 

自然语言处理NLP

词向量

腾讯AI实验室中文词向量语料库【Tencent AI Lab Embedding Corpus for Chinese Words and Phrases】

https://ai.tencent.com/ailab/nlp/embedding.html

tensorflow/tensor2tensor

https://github.com/tensorflow/tensor2tensor

 

图像识别

腾讯AI Lab正式开源业内最大规模多标签图像数据集

https://github.com/Tencent/tencent-ml-images

本次正式开源,其主要内容包括:

  • ML-Images数据集的全部图像URLs,以及相应的类别标注。因原始图像版权问题,此次开源将不直接提供原始图像,用户可利用腾讯AI Lab提供的下载代码和URLs自行下载图像。
  • ML-Images数据集的详细介绍。包括图像来源、图像数量、类别数量、类别的语义标签体系、标注方法,以及图像的标注数量等统计量。
  • 完整的代码和模型。腾讯AI Lab提供的代码涵盖从图像下载和图像预处理,到基于ML-Images的预训练和基于ImageNet的迁移学习,再到基于训练所得模型的图像特征提取的完整流程。项目提供了基于小数据集的训练示例,以方便用户快速体验该训练流程。项目还提供了具有极高精度的ResNet-101模型(在单标签基准数据集ImageNet的验证集上的top-1精度为80.73%)。用户可根据自身需求,随意选用该项目的代码或模型。
  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值