人工智能是什么？

最新推荐文章于 2024-09-30 21:48:12 发布

倪橙

最新推荐文章于 2024-09-30 21:48:12 发布

阅读量39

点赞数 1

分类专栏：神经网络科普深度学习科普人工智能科普文章标签：人工智能

本文链接：https://blog.csdn.net/WJXYGG/article/details/133361983

版权

神经网络科普同时被 3 个专栏收录

1 篇文章 0 订阅

订阅专栏

深度学习科普

1 篇文章 0 订阅

订阅专栏

人工智能科普

1 篇文章 0 订阅

订阅专栏

人工智能（Artificial Intelligence，简称AI）是一种模拟和模仿人类智能行为的技术。它通过使用计算机系统和算法，使机器能够学习、推理、理解和处理信息，以及在特定任务上表现出类似人类智能的能力。人工智能的应用范围非常广泛，包括自动驾驶、机器人、语音识别、图像处理、自然语言处理等。人工智能技术的发展和进步对社会和生活产生了深远的影响。

本文旨在对自己平时学习人工智能技术进行一些总结，顺便做一下科普，加入自己对人工智能的一些理解，尽可能讲得通熟易懂，让一些刚入门的小伙伴对人工智能有一个大概的了解。

1. 人工智能是怎么模拟和模仿人类智能行为的？

此时的你可以想一想，我们对一个事物的认识过程是怎么样的，比如一个杯子。

我们小时候第一次见到杯子时，如果没有人告诉你这是杯子，你是不是不知道这个“东西”就是杯子？只有别人告诉你或者你从书上看到一样的东西时，你才知道原来这个“东西”就是杯子。那么你是怎么判断这个“东西”是一个杯子的？想必你应该是观察到这个杯子的特点并记忆下来（这是人类的一种学习能力），比如这个杯子大致是一个圆柱的形状，但是比圆柱多出了一个“耳朵”，高度不高，宽度不是很宽，白色，你结合了这些特征，对一个物体进行匹配，如果你记下的这些特征都对应到了这个物体上，你就可以判断这个物体就是一个杯子，这就是人类对一个杯子的认知过程。

人工智能就是电脑模仿人类的认知行为，将电脑比作人脑，电脑是怎么认识杯子的？其实很简单，首先，电脑获取信息的途径是接收，可以接收图片、编码、数字等信息，当我们给电脑发送一张杯子的图片时，电脑第一次见到这个“东西”，它并不知道这是什么，你需要告诉它这是一个杯子，即当你输入一张杯子图片的同时你要给它输入一个标签，这个标签就是“杯子”两个字，通过一定手段，电脑记下了这张图像中杯子的特征，将这些特征记录下来，当你给电脑输入另一张含有某个物体的图像时，电脑就会对这个物体和前面记录下的特征进行匹配，如果匹配上了，电脑就会识别出这个物体就是杯子，反之就会识别出不是杯子，这就是电脑对一个杯子的认知过程。

看到这里，不知道你是否会想一个问题：“杯子”是一个广泛的概念，因为不同的杯子会有不同的特征，比如颜色不同、形状不同、高度不同、大小不同，但是它们都统称为“杯子”。

起初，人类对不同杯子的认识也是和认识上面第一个杯子一样的过程，但是人脑具有很强的推理能力，当你认识了足够多不同的杯子时，你见到一个从未见过的杯子，你也可以猜出它就是一个杯子。电脑也可以模仿到人脑的这种能力，前提是你得让电脑认识足够多的不同的杯子，即输入多张含有不同杯子的图像，并让电脑知道，这些都统称为杯子，电脑一一记下了这些杯子的特征，并进行总结与归纳即特征融合，电脑才能获取到人脑的推理能力。

2. 电脑通过什么手段模仿人类的认知和推理能力？

答案是深度学习，深度学习是一种利用复杂的神经网络来开发AI系统的技术。它可以模拟人脑的认知能力，将复杂的数据进行分类和分析。接下来我简单说一下深度学习的工作流程，具体的技术可以参考有关论文。本文只做科普和记录。

我们还是以认识杯子的任务作为例子，首先，将大量的有不同特征的杯子图像进行“整理”，以便适配不同算力的电脑，这个“整理”的过程就是数据集制作的过程，即将图片和标签区分开来，并将图片统一大小且进行训练集，验证集和测试集的划分，生成数据集。训练集主要是用来给神经网络训练，提取杯子的特征矩阵，记忆杯子的特征，就像人类的记忆杯子特征的过程；验证集就是用来验证记忆的效果，并根据记忆效果的好坏进行记忆调整；测试集用来学习完成之后的测试，看是否记忆准确，就像人脑认识了一些杯子后，去识别另一些没见过的杯子的过程。

其次，当你觉得图像数量不够，不同杯子的数量不够，不足以让电脑认识更多杯子时，可以进行数据的预处理，预处理包括数据增强，比如，一张杯子的图像只是在一个角度上拍摄的，一个杯子仅仅对应一张图像，当你从另一个角度看这个杯子，或者杯子有一部分被东西挡住，或者拍摄时光的亮度不一致时，对电脑来说，这个杯子在图像上的位置和大小、形状、颜色就可能不一样，电脑在测试过程中就识别不出这个是杯子。所以，当给电脑输入不同杯子的图像时，尽可能地获取到杯子不同角度、不同亮度、不同遮挡的影像，让电脑学习到杯子更加泛化的特征。这个过程就叫做数据增强。

神经网络输入的是图片，需要经过成千上万次的矩阵运算，所以对电脑的算力要求很高，所以，在将图片输入神经网络时，需要把数据进行分批多次输入，还可以对输入的图像进行下采样，降低图像的分辨率，这样可以让电脑尽可能一次性地少量运算，避免电脑崩溃。让电脑学习到不同图像中不同杯子的特征，图像可以看成一个矩阵，学习图像特征的过程也是求特征矩阵的过程，一般这个过程称为编码，应用卷积核是求特征矩阵的一个重要手段，当我们对下采样后的图像进行特征提取后，由于进行了下采样，我们需要把图像上采样回原来的大小，需要进行上采样，这个过程一般称为解码，解码之后得到最终提取结果，该提取结果可以转换为与输入标签相同的格式，并与标签进行比较，得到的差值称为误差，最后我们对误差进行反向传播，为了得到误差最小时所对应的特征权重，此时的权重就是杯子的所有特征，这个就是神经网络的训练过程。将得到的特征与测试集进行匹配，这个过程就是神经网络的测试和推理过程。电脑通过深度学习神经网络，学习到了人类的认知和推理过程。