人工智能概述(1)机器学习

1 人工智能概述

  • 首先,我们简单看看人工智能能做什么事情,以下是人工智能的应用,非常广阔:
    (1)网络安全(Cyber Security)
    (2)电子商务(E-Commer)
    (3)数值模拟(computational Simulation)
    (4)交通模式(Traffic Pattern)
    (5)社交网络(Social Networking)
    (6)传感器网络(Sensor Networks)
  • 人工智能小案例
    (1)画图识别物体名称:在画板上画出指定提示,然后系统自动识别是否画成
    参考链接:https://quickdraw.withgoogle.com
    (2)识别视频中动态的每个物体,并且表示它们各自的名称:
    参考链接:https://pjreddie.com/darknet/yolo/
    (3)风格迁移:将两幅图画融合的技术
    参考链接:https://deepdreamgenerator.com/

2 人工智能的历史发展

  • 人工智能的起源源自于计算机科学之父——艾伦-麦席森-图灵提出的“图灵测试”。测试内容是两个不同的测试者(一个是机器,一个是人)向被测试者(一个人)提问各种问题(一般为5min),如果有超过30%的被测试者不能确定提问方是机器还是人,那么就说明这个图灵测试成功,并且说这个机器具有人工智能。
  • 达特茅斯会议–人工智能的起点(一群大佬1956年开了两个月的会讨论机器来模仿人类学习及其其他方面的智能的应用,并且起了个名字,人工智能)
  • 发展历程

3 人工智能、机器学习和深度学习的关系

(1)机器学习是人工智能的一种实现方式
(2)深度学习是机器学习的一个方法

4 人工智能发展的3个条件

(1)数据
(2)算法
(3)计算能力(CPU,GPU和TPU)

  • CPU和GPU计算力的的对比
      CPU主要适合I\O密集型的任务(分配任务等)
      GPU主要适合计算密集型任务(人工智能各种算法都需要庞大的计算,所以一般机器学习,深度学习的算法一般都使用GPU)
    更多:http://www.sohu.com/a/201309334_468740
  • 什么样的程序适合在GPU上跑:
    (1)计算密集型的程序
      所谓计算密集型(Compute-intensive)的程序,就是其大部分运行时间花在了寄存器运算上,寄存器的速度和处理器的速度相当,从寄存器读写数据几乎没有延时。可以做一下对比,读内存的延迟大概是几百个时钟周期;读硬盘的速度就不说了,即便是SSD, 也实在是太慢了。
    (2)易于并行的程序
      GPU其实是一种SIMD(Single Instruction Multiple Data)架构, 他有成百上千个核,每一个核在同一时间最好能做同样的事情。
  • TPU介绍:https://zhuanlan.zhihu.com/p/82759438

5 人工智能的主要分支

  • 通信、感知和行动是现代人工智能的三个关键能力。根据这些能力对这三个技术领域进行分类有:
    (1)计算机视觉(CV)
    (2)自然语言处理(NLP):NLP中又可以划分为文本挖掘/分类机器翻译语音识别
    (3)机器人
  • 总的来说,人工智能领域的研究前沿正逐渐从搜索、知识和推理领域转向机器学习、深度学习、计算机视觉和机器人领域。大多数早期技术至少已经处于应用阶段了,而且其中一些已经显现出了社会影响力。一些新开发的技术可能仍处于工程甚至研究阶段,但是我们可以看到不同阶段之间转移的速度变得越来越快。

下面就根据这几个分支进行讲解:

5.1 分支1 计算机视觉

  • 概述
      计算机视觉是指机器感知环境的能力。这一技术类别中的经典人物有图像形成、图像处理、图像提取和图像的三维推理等。物体检测和人脸识别是比较成功的研究领域。
  • 当前阶段
      计算机视觉已经有很多应用了,所以可以将其归为应用阶段。随着深度学习的发展,机器甚至能在特定的案例中实现超越人类的表现。但是,这项技术离社会影响阶段还有一段距离,那要等到机器能在所有场景中都达到人类的同等水平才行(感知其环境的所有相关方面)。
  • 发展历史

5.2 分支2:语音识别

  • 概述
      语音识别是指识别语音(说出的语音)并将其转化为对应文本的技术。相反的任务(文本转语音/TTS)也是这一领域内一个类似的研究主题。
  • 当前阶段
      语音识别已经处于应用阶段很长时间了。最近几年同样因为大数据和深度学习技术的发展,语音识别进展颇丰,现在已经非常接近社会影响阶段了。
  • 语音识别领域仍然面临着声纹识别和“鸡尾酒会效应”等一些特殊情况的难题。另外,现代语音识别系统严重依赖于云,在离线时可能无法取得理想的工作效果。(鸡尾酒会效应:在酒会中,声音嘈杂,但是人脑可以自动识别自己想要听到的原因,而电脑对于这种问题还无法解决。)
  • 发展历史

eg:
百度语音识别:距离小于1米,中文字准确率97%以上。支持耳语,长语音,中英文混合及方言。

5.3 分支3:文本挖掘/分类

  • 概念
      文本挖掘主要指的就是文本分类,该技术可用于理解,组织和分类结构化或非结构化文本文档。其中包括的主要任务是句法分析、情绪分析垃圾信息检测
  • 当前阶段
      我们将这项技术归结到应用阶段,因为现在有很多应用都已经集成了基于文本挖掘的情绪分析垃圾信息检测技术。文本挖掘技术也在智能投顾的开发中有所应用,并且提升了用户体验。
    文本挖掘和分类领域的一个瓶颈出现在有歧义和有偏差的数据上。
  • 发展历史

5.4 分支4:机器翻译

  • 概述
      机器翻译(MT)是利用机器的力量将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)。机器翻译方法通常可以分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。
  • 当前阶段
      机器翻译是一个见证了大量发展历程的应用领域。该领域最近由于神经机器翻译而取得了非常显著的进展,但仍然没有全面达到专业译者的水平。但是,相信在大数据、云计算、和深度学习技术的帮助下,机器翻译会进入社会影响阶段
    某些情况下,俚语和行话等内容的翻译会比较困难(受限词表问题)。
    专业领域的机器翻译(比如医疗领域)表现通常不好。
  • 发展历史

5.5 分支5:机器人

  • 概念
      机器人学(Robotics)研究的是机器人的设计、制造、运作和应用,以及控制它们的计算机系统,传感反馈和信息处理。
       机器人可以分为两大类固定机器人移动机器人。固定机器人通常被用于工业生产(比如用于装配线)。常见的移动机器人应用有货运机器人、空中机器人、和自动载具。机器人需要不同部件和系统的写作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器。另外还有能够实现感知能力的软件,比如定位,地图测绘和目标识别。

  • 当前阶段
      自上世纪(Robot)一词诞生以来,人们已经为工业制造业设计了很多机器人。工业机器人是增长最快的应用领域,它们在20世纪80年代将这一领域带到了应用阶段。在安川电机等公司的努力下,我们认为进入21世纪之后,机器人领域就已经进入了社会影响阶段,此时各种工业机器人已经主宰了装配生产线。此外,软体机器人在很多领域也有广泛的应用,比如在医疗行业协助手术或在金融行业自动执行承销过程。
    但是,法律法规和“机器人威胁论”可能会妨碍机器人领域的发展,还有设计和制造机器人需要较高的投资。

  • 发展历史

6 机器学习的工作流程

6.1 什么是机器学习

  • 机器学习的过程就是从数据自动分析获得模型,并利用模型未知数据进行预测。

6.2 机器学习的过程

  • 机器学习的过程是:获取数据数据的基本处理特征工程机器学习(模型训练),模型评估 5个步骤。
6.2.1 获取数据
  • 我们可能获取到的数据有很多种类型,下面是数据集类型的几个实例:
    eg1:

    eg2:
    预测房价的价格。
    eg3:

  • 数据简介:在数据集中一般:
    (1)一行数据我们称为一个样本
    (2)一列数据我们成为一个特征
    (3)有些数据有目标值(标签值),有些数据没有目标值(如上表中,电影类型就是这个数据集的目标值)

  • 数据类型构成:
    (1)数据类型1:特征值+目标值(目标值又可以分为是连续的还是离散的)
    (2)数据类型2:只有特征值,没有目标值

  • 数据分割:机器学习一般的数据集会划分为两个部分:
    (1)训练数据:用于训练,构建模型
    (2)测试数据:在模型检验时使用,用于评估模型是否有效
    (3)划分比例:
      训练集:70% 80% 75%
      测试集:30% 20% 25%

6.2.2 数据基本处理

  就是对数进行缺失值,去除异常值等处理。目的是让机器能够更容易的处理这些数据。

6.2.3 特征工程
  • 概念
      特征工程是使用专业背景知识技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程。(意义:会直接影响机器学习的效果)
  • 为什么需要它:因为数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已(名句)。
  • 内容包括三点:特征提取特征预处理特征降维

  特征提取:将任意数据(比如文本或图像)转换为可用于机器学习的数字特征。

  特征预处理:通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程。

  特征降维:指在某些限定条件下,降低随机变量(特征)个数,因为有些特征可能不重要,或者转化为更高级别的特征,得到一组不相关“主变量”的过程。

6.2.4 模型训练

  有了经过特征工程处理过后的优质数据后,我们就可以把这些数据输入到想要训练的模型中,根据不同的场景进行拟合,在不停的训练过程中,就像有n个旋钮的密码箱,每一个旋钮就当成一个参数的大小,当所有旋钮都调成某一个合适的值的时候,密码箱就可以打开了,然后保存此时的参数值,这个时候我们就说这个模型训练好了。

6.2.5 模型评估
  • 模型评估是模型开发过程不可或缺的一部分。它有助于发现表达数据的最佳模型和所选模型将来工作的性能如何

  • 按照数据集的目标值不同,可以把模型评估分为分类模型评估和回归模型评估。
       (1)分类模型的评判指标有:准确率,精确率,召回率,F1-score、AUC等等
       (2)回归模型的评判指标有:均方根误差(Root Mean Squared Error,RMSE),相对平方误差(Relative Squared Error,RSE)、平均绝对误差(Mean Absolute Error,MAE)、相对绝对误差(Relative Absolute Error,RAE)等等

      回归模型放假预测举例:

      假设上面的房价预测,只有五个样本,对应的
      	真实值为:100,120,125,230,400
      	预测值为:105,119,120,230,410
    

  那么使用均方根误差求解得:

  •    R M S E = [ ( 100 − 105 ) 2 + ( 120 − 119 ) 2 + 5 2 + 0 2 + 1 0 2 ] 5 2 = 5.495 RMSE=\sqrt[2]{\frac{[(100-105)^2+(120-119)^2+5^2+0^2+10^2]}{5}}=5.495 RMSE=25[(100105)2+(120119)2+52+02+102] =5.495   越小越好。

  • 模型评估用于评价训练好的的模型的表现效果,其表现效果大致可以分为两类:过拟合欠拟合

  在训练过程中,你可能会遇到如下问题:训练数据训练的很好,误差也不大,为什么在测试集上面有问题呢?当算法在某个数据集当中出现这种情况,可能就出现了拟合问题。

  欠拟合:模型学习的太过粗糙,连训练集中的样本数据特征关系都没有学出来。

    因为机器学习到的天鹅特征太少了,导致区分标准太粗糙,不能准确识别出天鹅。

  过拟合:所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越,导致在测试数据集中表现不佳。

    机器已经基本能区别天鹅和其他动物了。然后,很不巧已有的天鹅图片全是白天鹅的,于是机器经过学习后,会认为天鹅的羽毛都是白的,以后看到羽毛是黑的天鹅就会认为那不是天鹅

7 机器学习的算法分类

  根据数据集组成的不同,以及要生成结果目标的不同,可以把机器学习算法分为4个种类,即:
    (1)监督学习
    (2)无监督学习
    (3)半监督学习
    (4)强化学习

7.1 监督学习

  输入数据是由输入特征值目标值所组成。函数的输出可以是一个连续的值(成为回归),或者输出有限个离散值(成为分类)。

  回归举例:预测房价,根据样本集拟合出一条连续曲线。

  分类举例:根据肿瘤特征判断良性还是恶性,得到的是结果是“良性”或者“恶性”,是离散的。

7.2 无监督学习

  输入数据是由输入特征值组成,没有目标值。输入数据没有被标记,也没有确定的结果。样本数据类别未知,需要根据样本间的相似性对样本集进行类别划分。

  有监督无监督的对比:

  无监督聚类举例:根据图片找出哪些为一个类别

7.3 半监督学习

  训练集同时包含有标记样本数据和未标记样本数据。

  有监督半监督的对比:

(1)监督学习训练方式:

(2)半监督学习训练方式:

7.4 强化学习

  实质是做决定(make decisions) 问题,即根据环境和奖惩机制自动进行决策,并且可以做连续决策。

  强化举例
  小孩想要走路,但在这之前,他需要先站起来,站起来之后还要保持平衡,接下来还要先迈出一条腿,是左腿还是右腿,迈出一步后还要迈出下一步。
  小孩就是 agent,他试图通过采取行动(即行走)来操纵环境(行走的表面),并且从一个状态转变到另一个状态(即他走的每一步),当他完成任务的子任务(即走了几步)时,孩子得到奖励(给巧克力吃),并且当他不能走路时,就不会给巧克力。
  主要包含五个元素:agent, action, reward, environment, observation;

  强化学习的目标就是获得最多的累计奖励。

  监督学习强化学习的对比

  • 独立同分布是什么
      在概率统计理论中,如果变量序列或者其他随机变量有相同的概率分布,并且互相独立,那么这些随机变量是独立同分布。
      在西瓜书中解释是:输入空间中的所有样本服从一个隐含未知的分布,训练数据所有样本都是独立地从这个分布上采样而得。
  • 简单解释独立同分布

(1)独立:每次抽样之间没有关系,不会相互影响
  举例:给一个骰子,每次抛骰子抛到几就是几,这是独立;如果我要抛骰子两次之和大于8,那么第一次和第二次抛就不独立,因为第二次抛的结果和第一次相关。

(2)同分布:每次抽样,样本服从同一个分布
  举例:给一个骰子,每次抛骰子得到任意点数的概率都是六分之一,这个就是同分布

(3)独立同分布:i.i.d.,每次抽样之间独立而且同分布

  • 独立同分布的重要性
    独立同分布即假设训练数据测试数据是满足相同分布的,它是通过训练数据获得的模型能够在测试集获得好的效果的一个基本保障。

注意:机器学习并不总要求独立同分布,在不少问题中要求样本数据采样自同一个分布是因为希望用训练数据集得到的模型可以合理的用于测试数据集,使用独立同分布假设能够解释得通。目前一些机器学习内容已经不再必须于独立同分布假设下,一些问题会假设样本没有同分布。

7.5 小结

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

jayden-leo

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值