神经网络相关
- 介绍 胶囊网络 (Capsule Network) 的序列博客:Understanding Hinton’s Capsule Networks
自然语言处理
- 这篇 博客 推荐了一些针对 样本不均衡的分类问题 的书籍、论文和工具库:
https://machinelearningmastery.com/resources-for-imbalanced-classification/ - 收集了大量 自然语言处理(NLP)领域语料 数据库的一个 导航网站:https://datasets.quantumstat.com/
- 总结 事件抽取(Event Extraction)相关论文的一个 GitHub 仓库:https://github.com/BaptisteBlouin/EventExtractionPapers
- 收集了上百种 预训练中文词向量 的一个 GitHub 仓库:https://github.com/Embedding/Chinese-Word-Vectors
- 斯坦福大学开设的 自然语言处理课程 CS224n: Natural Language Processing with Deep Learning,内有课程 ppt 以及视频。
- 卡内基梅隆大学的 自然语言处理课程 Neural Networks for NLP ,在 Youtube 上有 课程视频
- 复旦大学邱锡鹏老师推荐的 自然语言处理入门练习 NLP-Beginner:自然语言处理入门练习
- 清华大学刘知远老师提供的 自然语言处理入门建议 NLP研究入门之道
- 阐述 NLP 领域近期进展的一篇博客:https://thegradient.pub/nlp-imagenet/
- 收集 知识图谱 相关论文和教程的一个 GitHub 仓库:https://github.com/heathersherry/Knowledge-Graph-Tutorials-and-Papers
- 苏剑林苏神的 科学空间,里面有很多 NLP 相关的博文,质量极高。
- NLP 数据增强 工具包:nlpaug
- 图神经网络 实现工具包(支持 PyTorch、TensorFlow 等框架):Deep Graph Library (DGL)
相关技术
强化学习(Reinforcement Learning)
- 由 OpenAI 提供的有关深度强化学习的教育资源:https://spinningup.openai.com/en/latest/user/introduction.html
- 由 Lilian Weng 编写的系列博客 A (Long) Peek into Reinforcement Learning:https://lilianweng.github.io/lil-log/2018/02/19/a-long-peek-into-reinforcement-learning.html#key-concepts
迁移学习(Transfer Learning)
- 该博客是迁移学习的一个概述,描述了迁移学习的动机并讨论了迁移学习的实践应用与方法:https://ruder.io/transfer-learning/
- 该博客描述 NLP 领域的迁移学习:https://ruder.io/state-of-transfer-learning-in-nlp/
主动学习(Active Learning)
小样本学习与元学习(Few-shot Learning and Meta Learning)
- 介绍相关概念以及研究概况的系列博客:few-shot learning and meta-learning
机器学习
- 极力推荐 Chris Bishop 所著的《Machine Learning and Pattern Recognition》
数学基础
线性代数
- Pro. Gilbert Strang 的书 《Linear Algebra and Its Applications》,据我所知已经更新到第五版,但只找到 第四版 pdf
- Pro. Gilbert Strang 的课 Matrix Methods in Data Analysis, Signal Processing, and Machine Learning
凸优化(Convex Optimization)
- 书《Convex Optimization》by Dr. Stephen Boyd & Dr. Lieven Vanderberghe
- 课程 by Dr.Stephen Boyd
- 课程 CMU 10-725
概率图模型(Probabilistic Graphic Models)
- 书《Probabilistic Graphic Models》by Daphne Koller & Nir Friedman
- Coursera 上的课程 《Probabilistic Graphic Models Specialization》by Dr. Daphe Koller
非凸优化(Non-convex Optimization)
信息论(Information theory)
编程工具
sklearn
- sklearn.metrcs.classification_report:根据模型给出的分类(预测)结果与正确的分类结果之间的对比,得出包括 召回率, 精确率 和 F1 值在内的分类指标。
Return a string/dict that is a summary of the precision, recall, F1 score for each class in binary or multilabel classification.