用来收集各类资源,各大包括机器学习ML、深度学习DL、自然语言处理NLP、机器视觉等方向,更新ing~
课程资源
很多视频课程网易云课堂、腾讯课堂、MOOC等视频学习类网站都有资源,but,基本上B站上都有搬运工 ,有弹幕解释,有评论提供资料、作业、解析等,所以——B站大法好!
1.软件基础
视频教程:
- 莫烦python:python入门学习视频教程,小哥哥讲的很好
- Tensorflow中文社区:tensorflow教程,最流行的深度学习框架之一
书籍/文献教程:
- scikit-learn (sklearn) 官方文档中文版:scikit-learn 是基于 Python 语言的机器学习工具
- scikit-learn (sklearn) 官方文档英文版
工具使用手册:
2.数理基础
书籍/文献教程:
- 李航 统计学习方法:统计学相关理论
- 机器学习中的基本数学知识
3.机器学习
视频教程:
- 吴恩达 机器学习:机器学习入门课程,很适合入门级选手
- Hinton 面向机器学习的神经网络
- 台湾大学林轩田 机器学习基石
- 台湾大学林轩田 机器学习技法
- 台湾大学李宏毅的机器学习课程2017
书籍/文献教程:
- 周志华 机器学习:西瓜书,机器学习理论
- The Auton Lab:Andrew Moore大牛的Data Mining Tutorial系列非常赞
4.深度学习
视频教程:
书籍/文献教程:
- 伊恩·古德费洛 深度学习:花书,深度学习理论
5.自然语言处理
NLP四大类任务:
- 序列标注:中文分词,词性标注,命名实体识别,语义角色标注……
- 分类任务:文本分类,情感计算……
- 句子关系判断:Entailment,QA,语义改写,自然语言推理……
- 生成式任务:机器翻译,文本摘要,写诗造句,看图说话……
视频教程:
- CS224n 斯坦福深度自然语言处理:原名 Deep Learning for Natural Language Processing (深度自然语言处理),是全球 NLP 领域最受欢迎的课程之一,让你在了解丰富的深度自然语言处理应用案例的同时,学会在实践中搭建出最先进的自然语言处理模型。
- 斯坦福大学CS224d课程的中文版内容笔记:由寒小阳和龙心尘翻译和整理,得到斯坦福大学课程@Richard Socher教授的授权翻译与发表
- 牛津大学&DeepMind 自然语言处理
- 哥伦比亚大学Michael Collins教授的nlp课程,这门课的好处就是讲解的非常简单,无痛苦入门,之前Coursera上开了这门课,相应的资源可以在知乎上搜一下,Michael教授的笔记如行云流水,不可多得
- Stanford的DAN JURAFSKY 和Christopher Manning的NLP课程,该课程是对1的补充,内容涵盖的也更加丰富,Coursera上也开过,目前被清了,资源知乎内找找吧
- Stanford的CS224N,同样是Stanford的NLP经典课程,这门课主要采用深度学习的视角进行。以上三门课,如果题主好好完成,做完作业,应该会有很多的收获。
书籍/文献教程:
- 国际计算语言学协会(ACL,The Association for Computational Linguistics):ACL成立于1962年,是自然语言处理(NLP)领域影响力最大、最具活力的顶级国际学术组织。多查阅ACL论文,有助于了解更多更新的知识
- 《Python自然语言处理》:从输入法联想提示(predictive text)、email过滤到自动文本汇总、机器翻译,大量的语言相关的技术都离不开自然语言处理的支持,而这本书提供了自然语言处理的入门指南。通过本书,你将学到如何编写能处理大量非结构化文本的Python程序。你可以访问具有丰富标注的、涵盖了语言学各种数据结构的数据集,而且你将学习分析书面文档的内容以及结构的主要算法
- 《基于深度学习的自然语言处理》:本书系统阐述将深度学习技术应用于自然语言处理的方法和技术,深入浅出地介绍了深度学习的基本知识及各种常用的网络结构,并重点介绍了如何使用这些技术处理自然语言
- 《NLP高效沟通》(趣味漫画图文版):国际上大量案例证明,从破解成功人士语言和思维模式入手的NLP,能够帮助人们改善沟通质量,拥有好的人际关系和成功的未来
- 《自然语言处理入门》:这是一本把读者阅读体验放在首位的中文 NLP 图书,作者采用从问题到算法再到工程实现的写作思路,只允许必不可少的公式出现,降低了读者学习的门槛,通俗易懂、容易上手。是一本可以在地铁上也能学会 NLP 开发的图书
经验贴:
- 《Resource Sharing》---NLP专题分享之【学习资料推荐】:https://discussion.datafountain.cn/questions/2294
6.计算机视觉
视频教程:
书籍/文献教程:
7.语音识别
实战经验:
- 用深度学习(CNN RNN Attention)解决大规模文本分类问题 - 综述和实践:北邮毕业,就职阿里搜索排序,深度学习在文本分类中应用时总结的经验心得,很受用
- NLP文本分类实战: 传统方法与深度学习:对比传统机器学习方法和深度学习方法在NLP中的使用
- Understanding Convolutional Neural Networks for NLP:CNN在NLP领域的理解,文章写得很通俗易懂,值得多看几次
竞赛教程:
- 知乎“看山杯” 夺冠记:多学习大神们的竞赛思路,在工程应用和竞赛中都有帮助
- Sebastian Ruder:NLP领域中一个大神的网站,对NLP的理解和看法
开放平台/开源模型
直接调用开放平台的API接口或SDK
谷歌最强 NLP 模型 BERT
github项目地址https://github.com/google-research/bert
论文原文https://arxiv.org/pdf/1810.04805.pdf
- 两行代码玩转 Google BERT 句向量词向量:使用bert迁移学习教程
百度AI开放平台
腾讯AI开放平台
网易AI平台
自然语言处理NLP
词向量
腾讯AI实验室中文词向量语料库【Tencent AI Lab Embedding Corpus for Chinese Words and Phrases】
https://ai.tencent.com/ailab/nlp/embedding.html
tensorflow/tensor2tensor
https://github.com/tensorflow/tensor2tensor
图像识别
腾讯AI Lab正式开源业内最大规模多标签图像数据集
https://github.com/Tencent/tencent-ml-images
本次正式开源,其主要内容包括:
- ML-Images数据集的全部图像URLs,以及相应的类别标注。因原始图像版权问题,此次开源将不直接提供原始图像,用户可利用腾讯AI Lab提供的下载代码和URLs自行下载图像。
- ML-Images数据集的详细介绍。包括图像来源、图像数量、类别数量、类别的语义标签体系、标注方法,以及图像的标注数量等统计量。
- 完整的代码和模型。腾讯AI Lab提供的代码涵盖从图像下载和图像预处理,到基于ML-Images的预训练和基于ImageNet的迁移学习,再到基于训练所得模型的图像特征提取的完整流程。项目提供了基于小数据集的训练示例,以方便用户快速体验该训练流程。项目还提供了具有极高精度的ResNet-101模型(在单标签基准数据集ImageNet的验证集上的top-1精度为80.73%)。用户可根据自身需求,随意选用该项目的代码或模型。