人工智能是什么?

人工智能(Artificial Intelligence,简称AI)是一种模拟和模仿人类智能行为的技术。它通过使用计算机系统和算法,使机器能够学习、推理、理解和处理信息,以及在特定任务上表现出类似人类智能的能力。人工智能的应用范围非常广泛,包括自动驾驶、机器人、语音识别、图像处理、自然语言处理等。人工智能技术的发展和进步对社会和生活产生了深远的影响。

        本文旨在对自己平时学习人工智能技术进行一些总结,顺便做一下科普,加入自己对人工智能的一些理解,尽可能讲得通熟易懂,让一些刚入门的小伙伴对人工智能有一个大概的了解。

1.  人工智能是怎么模拟和模仿人类智能行为的?

        此时的你可以想一想,我们对一个事物的认识过程是怎么样的,比如一个杯子。

 我们小时候第一次见到杯子时,如果没有人告诉你这是杯子,你是不是不知道这个“东西”就是杯子?只有别人告诉你或者你从书上看到一样的东西时,你才知道原来这个“东西”就是杯子。那么你是怎么判断这个“东西”是一个杯子的?想必你应该是观察到这个杯子的特点并记忆下来(这是人类的一种学习能力),比如这个杯子大致是一个圆柱的形状,但是比圆柱多出了一个“耳朵”,高度不高,宽度不是很宽,白色,你结合了这些特征,对一个物体进行匹配,如果你记下的这些特征都对应到了这个物体上,你就可以判断这个物体就是一个杯子,这就是人类对一个杯子的认知过程。

        人工智能就是电脑模仿人类的认知行为,将电脑比作人脑,电脑是怎么认识杯子的?其实很简单,首先,电脑获取信息的途径是接收,可以接收图片、编码、数字等信息,当我们给电脑发送一张杯子的图片时,电脑第一次见到这个“东西”,它并不知道这是什么,你需要告诉它这是一个杯子,即当你输入一张杯子图片的同时你要给它输入一个标签,这个标签就是“杯子”两个字,通过一定手段,电脑记下了这张图像中杯子的特征,将这些特征记录下来,当你给电脑输入另一张含有某个物体的图像时,电脑就会对这个物体和前面记录下的特征进行匹配,如果匹配上了,电脑就会识别出这个物体就是杯子,反之就会识别出不是杯子,这就是电脑对一个杯子的认知过程。

        看到这里,不知道你是否会想一个问题:“杯子”是一个广泛的概念,因为不同的杯子会有不同的特征,比如颜色不同、形状不同、高度不同、大小不同,但是它们都统称为“杯子”。

起初,人类对不同杯子的认识也是和认识上面第一个杯子一样的过程,但是人脑具有很强的推理能力,当你认识了足够多不同的杯子时,你见到一个从未见过的杯子,你也可以猜出它就是一个杯子。电脑也可以模仿到人脑的这种能力,前提是你得让电脑认识足够多的不同的杯子,即输入多张含有不同杯子的图像,并让电脑知道,这些都统称为杯子,电脑一一记下了这些杯子的特征,并进行总结与归纳即特征融合,电脑才能获取到人脑的推理能力。

2.  电脑通过什么手段模仿人类的认知和推理能力?

        答案是深度学习,深度学习是一种利用复杂的神经网络来开发AI系统的技术。它可以模拟人脑的认知能力,将复杂的数据进行分类和分析。接下来我简单说一下深度学习的工作流程,具体的技术可以参考有关论文。本文只做科普和记录。

        我们还是以认识杯子的任务作为例子,首先,将大量的有不同特征的杯子图像进行“整理”,以便适配不同算力的电脑,这个“整理”的过程就是数据集制作的过程,即将图片和标签区分开来,并将图片统一大小且进行训练集,验证集和测试集的划分,生成数据集。训练集主要是用来给神经网络训练,提取杯子的特征矩阵,记忆杯子的特征,就像人类的记忆杯子特征的过程;验证集就是用来验证记忆的效果,并根据记忆效果的好坏进行记忆调整;测试集用来学习完成之后的测试,看是否记忆准确,就像人脑认识了一些杯子后,去识别另一些没见过的杯子的过程。

        其次,当你觉得图像数量不够,不同杯子的数量不够,不足以让电脑认识更多杯子时,可以进行数据的预处理,预处理包括数据增强,比如,一张杯子的图像只是在一个角度上拍摄的,一个杯子仅仅对应一张图像,当你从另一个角度看这个杯子,或者杯子有一部分被东西挡住,或者拍摄时光的亮度不一致时,对电脑来说,这个杯子在图像上的位置和大小、形状、颜色就可能不一样,电脑在测试过程中就识别不出这个是杯子。所以,当给电脑输入不同杯子的图像时,尽可能地获取到杯子不同角度、不同亮度、不同遮挡的影像,让电脑学习到杯子更加泛化的特征。这个过程就叫做数据增强。

        神经网络输入的是图片,需要经过成千上万次的矩阵运算,所以对电脑的算力要求很高,所以,在将图片输入神经网络时,需要把数据进行分批多次输入,还可以对输入的图像进行下采样,降低图像的分辨率,这样可以让电脑尽可能一次性地少量运算,避免电脑崩溃。让电脑学习到不同图像中不同杯子的特征,图像可以看成一个矩阵,学习图像特征的过程也是求特征矩阵的过程,一般这个过程称为编码,应用卷积核是求特征矩阵的一个重要手段,当我们对下采样后的图像进行特征提取后,由于进行了下采样,我们需要把图像上采样回原来的大小,需要进行上采样,这个过程一般称为解码,解码之后得到最终提取结果,该提取结果可以转换为与输入标签相同的格式,并与标签进行比较,得到的差值称为误差,最后我们对误差进行反向传播,为了得到误差最小时所对应的特征权重,此时的权重就是杯子的所有特征,这个就是神经网络的训练过程。将得到的特征与测试集进行匹配,这个过程就是神经网络的测试和推理过程。电脑通过深度学习神经网络,学习到了人类的认知和推理过程。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值