人工智能基本概念

人工智能入门系列文章

        本系列文章为本人现在起步学习人工智能领域知识所总结和记录的一些知识点,纯属从零开始学习,如有不规范,疏漏,和错误的地方,还请各位道友多多包涵理解。有任何建议和指正,本人都真心接受并且感激,还请不吝赐教。


人工智能?机器学习?深度学习,这些都是什么鬼

        随着现在AI在各领域的火爆展现出蓬勃生机,各大高校也逐步开设了人工智能相关的专业。相信大家跟我一样,在各大论坛,开源网站都能看到诸如 ”深度学习“,”机器学习“,”人工智能xxx“等相关字眼,大家肯定很疑惑,这些概念之间到底有什么联系。

        那么先讲讲人工智能的概念吧

一、人工智能 

        “人工智能”(Artificial Intelligence),英文缩写为 AI 从字面意思来看,它指的是让机器获得像人一样的智慧。人工智能是计算机科学技术的一个分支,指的是通过机器和计算机来模拟人类智力活动的过程。人工智能自 1950 年诞生以来,理论和技术日益成熟,应用领域也不断扩大,涉足了领域包括机器人、语言识别、图像识别、自然语言处理等。人工智能并不是人的智能,而是让机器像人一样思考,甚至于超过人类。

        如何让计算机,让机器做到像人类一样思考,去处理问题,认识问题,是人工智能首先面临的一大问题。那么人类是如何处理问题呢,就像我们刚出生的时候,如何知道1+1 =2 ,又如何在知道加减乘除运算法则的基础上能够进行各种数学运算呢,靠的就是认识和学习。

        那么自然,机器要想像人类一样思考,也要通过”学习“先认识已有的事物,才能去判断未知的事物。这就引出了机器学习的概念。

二、机器学习

        机器学习是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,使之不断改善自身的性能。

        我认为的机器学习,就是提供大量的数据让计算机通过无数次的认识训练出一个模型(或者可以理解为函数)既一个Y = F(X)的函数。那么我们就可以通过输入的样本X,通过训练得到的函数F(X)计算得到预测的结果Y。

2.1 机器是怎样训练得到模型和预测函数的

        这里拿牛顿第二定律的实验为例,高中学过物理的小伙伴们肯定对下面这两个实验很熟悉吧

                                                                注:图片为外部引用,侵删

        实验原理这里就不做过多解释了,感兴趣的朋友可以自行百度了解一下。

                       

         简略的实验结果如下,总之,通过实验我们大致可以得出一个结论,即作用力F与加速度a之间的关系是一个线性关系。F = m*a,这是牛顿第二定律的结论,我们可以很轻松的知道作用力就等于加速度与物体质量的乘积,那么重点来了,我们是通过已有资料告诉我们这个结论的,那么牛顿,或者说机器要怎样训练才能得出这样的预测函数呢?

 2.2 机器如何确定参数模型

        首先,什么是参数模型。用我们上面牛顿第二定律实验的例子来说明,这个加速度预测模型的参数就是 1/m,因为(a = F/m)我们用 w = 1/m 来表示这个参数。

        我们如何确定 w 这个参数呢,在机器学习中,确定某一个参数模型有效的前提条件是,通过这个参数模型预测得到的结果要能够拟合已知的样本。(意思就是说,你得到的函数,你输入一个x 计算得到的y 要跟你之前实验预测得到的结果是相同或者高度近似的,这样你才能初步认为你得到的参数模型是正确的,有效的) 

        无论是人,还是机器,我们都不可能一次就得到正确的答案,都需要不断地逼近真理,机器学习的过程也可以理解为一个不断对已有模型进行不断优化的过程,下图中,假设H(w,x)是我们初步得到的模型,这里要引入一个术语 ”评价函数“ —— 即我们输入已知样本x ,通过我们训练的模型H()计算得到的结果与真实实验得到的结果Y 之间的差距,这个差距当然是越小越好,差距越小说明我们训练得到的模型越可信,越拟真。这里还要提一点,我们通过训练出来的模型计算得到的数据也叫预测数据,这个评价函数,也叫损失函数。

                             

                                                         模型训练示意图

        假设机器通过尝试答对(最小化损失)大量的习题(已知样本)来学习知识(模型参数w),并期望用学习到的知识所代表的模型H(w,x),回答不知道答案的考试题(未知样本)。最小化损失是模型的优化目标,实现损失最小化的方法称为优化算法,也称为寻解算法(找到使得损失函数最小的参数解)。参数w和输入数据X组成公式的基本结构称为假设。在牛顿第二定律的案例中,基于对数据的观测,我们提出了线性假设,即作用力和加速度是线性关系,用线性方程表示。由此可见,模型假设、评价函数(损失/优化目标)和优化算法是构成模型的三个关键要素

 2.3 模型假设,评价函数和优化算法机器学习中具体作用

  • 模型假设:世界上的可能关系千千万,漫无目标的试探Y~X之间的关系显然是十分低效的。因此假设空间先圈定了一个模型能够表达的关系可能,就是先划一个大致范围。机器还会进一步在假设圈定的圆圈内寻找最优的Y~X关系,即确定参数w。
  • 评价函数:寻找最优之前,我们需要先定义什么是最优,即评价一个Y~X关系的好坏的指标。通常衡量该关系是否能很好的拟合现有观测样本,将拟合的误差最小作为优化目标。
  • 优化算法:设置了评价指标后,就可以在假设圈定的范围内,将使得评价指标最优(损失函数最小/最拟合已有观测样本)的Y~X关系找出来,这个寻找最优解的方法即为优化算法。最笨的优化算法即按照参数的可能,穷举每一个可能取值来计算损失函数,保留使得损失函数最小的参数作为最终结果。

三、深度学习

        终于讲到深度学习了,也是最后一个板块,其实在我看来,人工智能,机器学习,深度学习之间的关系是一个包含与被包含的集合关系

        大致像这样的图片关系。

          ​​​​​​​

         

        机器学习算法理论在上个世纪90年代发展成熟,在许多领域都取得了成功,但平静的日子只延续到2010年左右。随着大数据的涌现和计算机算力提升,深度学习模型异军突起,极大改变了机器学习的应用格局。今天,多数机器学习任务都可以使用深度学习模型解决,尤其在语音、计算机视觉和自然语言处理等领域,深度学习模型的效果比传统机器学习算法有显著提升。

相比传统的机器学习算法,深度学习做出了哪些改进呢?其实两者在理论结构上是一致的,即:模型假设、评价函数和优化算法,其根本差别在于假设的复杂度

         比如我们看见一个人,我们的大脑会很快反应过来这是一个男人还是女人,这是一个长得好看的人还是普通的人等等。但是计算机无法识别,计算机只能把我们看到的人分解成数字矩阵,从数字矩阵变换到人这个概念的过程是十分复杂的。

        这样的概念变换已经无法用数学公式来表达,因此科学家们借鉴了人脑神经元的结构,设计出了神经网络的模型。

3.1 神经网络的基本概念

         人工神经网络包括多个神经网络层,如:卷积层、全连接层、LSTM等,每一层又包括很多神经元,超过三层的非线性神经网络都可以被称为深度神经网络。通俗的讲,深度学习的模型可以视为是输入到输出的映射函数,如图像到高级语义(人)的映射,足够深的神经网络理论上可以拟合任何复杂的函数。因此神经网络非常适合学习样本数据的内在规律和表示层次,对文字、图像和语音任务有很好的适用性。这几个领域的任务是人工智能的基础模块,因此深度学习被称为实现人工智能的基础也就不足为奇了。

        简单看看神经网络的基本结构吧

  • 神经元: 神经网络中每个节点称为神经元,由两部分组成:
    • 加权和:将所有输入加权求和。
    • 非线性变换(激活函数):加权和的结果经过一个非线性函数变换,让神经元计算具备非线性的能力。
  • 多层连接: 大量这样的节点按照不同的层次排布,形成多层的结构连接起来,即称为神经网络。
  • 前向计算: 从输入计算输出的过程,顺序从网络前至后。
  • 计算图: 以图形化的方式展现神经网络的计算逻辑又称为计算图,也可以将神经网络的计算图以公式的方式表达:

 

 由此可见,神经网络并没有那么神秘,它的本质是一个含有很多参数的“大公式”。如果大家感觉这些概念仍过于抽象,理解的不够透彻,先不用着急,后面会以“房价预测模型”为例,演示使用Python实现神经网络模型的细节。


总结

        人工智能的范畴十分广大,笔者也是真正的从零开始入门,还是一个非常单纯的小白。在简单了解了人工智能,机器学习与深度学习的相关概念和实现流程之后,也会持续努力学习,争取早日可以动手实操设计出可以使用的模型。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值