【深度学习00】绪论

一碗姜汤

已于 2024-05-21 17:35:19 修改

阅读量50

点赞数

分类专栏：深度学习文章标签：深度学习人工智能

于 2023-07-25 18:14:26 首次发布

本文链接：https://blog.csdn.net/weixin_55252589/article/details/131921497

版权

深度学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

前言：

有两点是大家必须去关注的：

1. 深度学习的基础理论：不仅仅在知道某个网络他的结构这样一个很浅的基础上，需要知道这个网络具体的，比如说参数是如何计算的，他的代码实现是怎么去做的，甚至你可以去自己构建一个网络，当然这就需要你对这个网络本身有着深入的了解，对代码水平方面提出了更高的层次。

2. 实践层面：不要拿一个数学理论的眼光去看待深度学习和人工智能，这是一个非常基础的看法，人工智能本身就是一个实践的学科，他是计算机科学的一部分。他的基础永远不是数学理论，也永远不是某些深度学习的paper，他的基础是计算机科学。而掌握一个良好的编程能力对于学习深度学习来说是一个非常好的起点。

There are a few points that everyone must pay attention to:

1. Theoretical level：The basic theory of deep learning is not only based on the shallow foundation of knowing the structure of a certain network, but also needs to know the specifics of the network, such as how the number of parameters is calculated, how its code is implemented, and you can even build a network by yourself. This requires you to have a deep understanding of the network itself, and a higher level of code level is proposed.

2. Practical level：Don't look at deep learning and artificial intelligence from the perspective of a mathematical theory. This is a very basic view. Artificial intelligence itself is a practical subject, which is a part of computer science. His foundation is never mathematical theory, nor is it some deep learning paper. His foundation is computer science. And mastering a very good programming ability is a terrific starting point for learning deep learning.

绪论

大数据时代，大家挖掘的往往是结构化的数据，现在深度学习的时代，深度学习所学习的往往是非结构化的数据，深度学习为人类数据学习的过程打开了一个新的大门。

1.1 人工智能的萌芽和生长——从专家系统到机器学习：

专家系统：只能处理一些及其可控的问题，推广能力非常差。
机器学习：能够通过现有的数据中进行学习。但是特征提取的过程还是需要人的存在。所以机器学习，本质上不是一个端到端（End to End）的学习过程。

什么是“端到端”？—— 我们输入原始数据和label，也就是一些样本。并且无需人工干预，就能够建立整个模型。

1.2 数据驱动的人工智能

大数据技术的出现

数据的涌现

4V - Volume( 容量 ); Variety ( 多样性 ); Value ( 价值 ); Velocity ( 速度)

计算能力的提升

CPU; GPU;异构计算; 分布式集群

大数据的发展给人工智能的表演提供了舞台。

2.1一些简单的人工智能问题

有监督：
拟合-Regression
分类-Classification（90%的问题都属于分类问题）

无监督：
聚类-Clustering（重要程度仅次于分类问题）
异常检测-Anomaly Detection

2.2 复杂的人工智能问题

下图左边属于图像分割(语义分割)，右图属于目标检测。目前只有深度学习才能搞定。

3.1 为什么要做深度学习 ?

对比机器学习，其实机器学习更像是老师给孩子一本书，并指出哪些是重点。然后这个孩子根据这些重点提取的特征来进行学习。
但是深度学习我们并没有告诉它哪些是重点。直接给它扔了一堆教材让它去学。而它的智商也的确很高，能够学到更多的东西。
随着数据量的逐渐增加，一开始可能机器学习性能会优于深度学习，因为在学习任务相对比较少的情况下，你画了重点，跟没画重点，考试结果肯定是会有所差别的。但是一旦到达某个数据临界点，深度学习超过了机器学习，机器学习往后的性能表现就开始比较平滑，完全比不上深度学习。深度学习的智商肯定是要高过机器学习的。但条件是需要有足够的数据支撑，否则巧妇难为无米之炊。

于是乎在深度学习这样一个范式下，跨界成了一个特别流行的词，因为许多计算机的同学发现自己无所不能，只要有标注数据，即便不懂得行业知识，我就可以做我的深度学习模型，所谓：我不行，但我的模型可以！

总之深度学习正在，变革我们的生活方式，驱动这个时代的发展，让我们一起加入这个令人兴奋的领域吧。

核心技术：
1. 使用TensorFlow编写模型结构
2. 在真实样本上构建数据读取与模型训练的全流程
3. 在模型迭代过程中，选择适当的超参数(学习率、Batch Size、GPU数等)
4. 通过数据增强提高模型的鲁棒性
5. 图像分割模型预测结果的后处理方法

9. 分布式系统实战——分布式深度学习推理系统

项目亮点：
基于容器技术，结合TensorFlow Serving的工业化部署能力，构建分布式深度学习推理系统。实现多GPU并行的模型推理过程

1. 使用Docker与TensorFlow Serving架构应用于多GPU的推理系统
2. 掌握分布式系统架构的基础方法论

核心技术：
1. 基于Docker的容器化技术，实现GPU级别的资源隔离
2. 分布式系统架构的基本要素
3. 使用TensorFlow Serving实现模型的高效推理
4. 将整套系统应用于生产实践

10. 关于薪资水平：

大概年薪：25W-80W

其中：25W是一个算法工程师的水平，80W是一个算法科学家或者算法管理人员的水平。

25W意味着：对于基础理论非常的了解，能够去实现一些现有的模型架构，能够在工程实践中实现一些简单的模型体系去解决现实的问题。再往上意味着能够去构建自己的网络结构，甚至构建自己的工程结构。

80W除了以上的能力之外，拥有非常丰富的架构能力。同时拥有一定的管理能力。能够带领一帮小兄弟完成一个项目从初始到最终的过程。

在学习过程中，要不断对自己提出更高的要求：

1. 在基础理论学习的时候，要想到自己的基础理论是否足够的扎实，一些问题是不是我应该找一些paper去读。

2. 在工程实践的时候，会讲到很多系统架构层面的基础理论，大家是不是应该去找一些教材，去更加深入地了解系统架构的知识。

3. 在代码实战的过程中，大家是否能够跳出这个项目，把自己作为这个项目的leader，去思考这样一个项目他的前因后果是什么；如果大家是一个项目经理，应该怎么去规划项目的研发进度、最开始该怎么获取数据、如何去构造一套模型的全流程体系、如何去把模型进行更快速的上线、同时这个模型未来会有哪些潜在的商业价值，甚至说大家可以想到这个产品未来的形态是什么、他的客户群体是谁。

如果有了这样一个能力，相信大家能够从25W跃迁到80W的年薪。当然到达80W的年薪是需要时间积累的，管理人和管理技术会有一定的区别，所以大家在以后的工作学习中能够多思考，多实践，把自己的价值提高。