GitHub 3K+收藏的从0到1 NLP学习路线图长什么样？_github上关于nlp学习资料-CSDN博客

本文链接：https://blog.csdn.net/Javachichi/article/details/140496616

“ 大模型LLM（Large Language Model)发展得如火如荼，对LLM跃跃欲试的你是否还觉得无从下手？想入门大模型，先学习作为大模型基础的NLP（Natrual Language Processing）。”

大模型LLM（Large Language Model)发展得如火如荼，对LLM跃跃欲试的你是否还觉得无从下手？想入门大模型，先学习作为大模型基础的NLP（Natrual Language Processing）。

如何学习NLP？GitHub 3K+收藏的从0到1 NLP学习路线图值得你收藏。

Tae-Hwan Jung的NLP整体学习路线图

这份路线图源自一个名叫Tae-Hwan Jung的韩国小伙伴，整体路线图从数学中的基础概念开始，到顶层的NLP的常用方法和著名算法，各种知识点全面覆盖。他将自己绘制的精美路线图上线到Reddit上不到一天热度就超过400。

一个名叫graykode的GitHub网友在将其上传至Github后，迄今已收到3.1K+赞同。

—

整体路线图

Tae-Hwan Jung的NLP整体学习路线图

NLP整体学习路线图：

数学基础：概率与统计（Probability and Statistics）、线性代数（Algebra）、数值计算（Numerical Computation）、算法（Algorithm)。
语言确认(Linguistic Acknowledegement)
机器学习（Machine Learning）
文本挖掘方法（Text Mining Method）
自然语言处理（Natural Language Processing）

Tae-Hwan Jung对概率与统计、机器学习、文本挖掘方法、自然语言处理其四个部分画出了详细的学习路线。

—

概率与统计

概率与统计学习路线分为五个重点部分：

—

机器学习

机器学习路线图分八个主要部分：

—

文本挖掘

文本挖掘（Text Mining）是学习自然语言处理需要的的基础背景，包括六个主要部分：

NLP基本假设（NLP Basic Hypothesis）:如向量空间模型（Vector Space Model，VSM）假设、统计语义假设（Statistical Sematic Hypothesis）、词袋模型假设（Bag of Words Hypothesis）
基本程序（Basic Procudure）：形态和词汇（Morphological and Texical）、句法（Syntax）
图（Graph）：排序算法（Ranking Algorithm）、相似性（Similarity)
文件（Document）：句子距离（String Distance）、分类算法（Classification）、聚类算法（Clustering）、词向量表示（Term Vector Representation)等
词嵌入（Word Embedding)
序列标注（Sequential Labeling)

—

自然语言处理

前面铺垫了那么多，终于到NLP技能成型的时候了。

基于深度学习的NLP学习路线主要包括四大部分：

基础模型（Basic）：Recurrent Model、Convolutional Model等
分布式表示（Distribution Representation）：Word Representation、Co-occurence Matrix
语言模型（Language Model）：如注明的Encoder-Decoder Model、Word Representation to Contextual Representation Model
任务练习（Task）：只学不练是不行的，需要结合具体任务练习模型

NLP从0到1的学习路线图到此介绍完毕，敬请收藏！

如果觉得有用，请点个“在看”，多多转发！！！