人工智能课程概述

这是一篇关于人工智能课程的概述,涵盖了人工智能的基本概念、机器学习的定义、目的及形式,强调了机器学习的分类,如有监督、无监督和半监督学习,并介绍了机器学习在实际中的应用和基本问题,如回归、分类和聚类。同时,文章还提到了数据预处理的重要性及其方法,如标准化、范围缩放和归一化。
摘要由CSDN通过智能技术生成

一、人工智能课程概述

1. 什么是人工智能

人工智能(Artificial Intelligence)是计算机科学的一个分支学科,主要研究用计算机模拟人的思考方式和行为方式,从而在某些领域代替人进行工作.

2. 人工智能的学科体系

以下是人工智能学科体系图:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ygAsAjXe-1639661142595)(img/AI_structure.png)]

  • 机器学习(Machine Learning):人工智能的一个子学科,研究人工智能领域的基本算法、原理、思想方法,机器学习研究的内容在其它子学科都会用到
  • 计算机视觉(Computer Vision):研究计算机处理、识别、理解图像、视频的相关技术
  • 自然语言处理(Natural Language Processing):研究计算机理解人类自然语言的相关技术
  • 语言处理:研究计算机理解识别、理解、合成语音的相关技术

3. 人工智能与传统软件的区别

  • 传统软件:执行人的指令和想法,在执行之前人已经有了解决方案,无法超越人的思想和认识范围
  • 人工智能:尝试突破人的思想和认识范围,让计算机学习到新的能力,尝试解决传统软件的难题

4. 课程介绍

1)课程内容

课程内容主要包括:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-oI0onYcZ-1639661142596)(img/AI_course.png)]

2)课程特点

  • 内容多:包括机器学习、深度学习、计算机视觉、NLP、常用框架
  • 难度大:学习难度较大,入门难、提高难、应用难
  • 需要部分数学知识:记住结论、会调用API、能分析公式、公式推导
  • 需要反复学习:第一轮听懂主要内容、第二轮理解核心概念、第三轮熟悉代码编写、第四轮深入理解和应用
  • 越学越深

3)学习方法

  • 先听懂、重理解
  • 先易后难,先听后写,先粗后细
  • 跳过过难的知识点,抓大放小
  • 多看不同作者的教材,多听不同老师的讲解

二、机器学习基本概念

1. 什么是机器学习

1975年图灵奖获得者、1978年诺贝尔经济学奖获得者、著名学者赫伯特.西蒙(Herbert Simon)曾下过一个定义:如果一个系统,能够通过执行某个过程,就此改进了它的性能,那么这个过程就是学习.由此可看出,学习的目的就是改善性能.

卡耐基梅隆大学机器学习和人工智能教授汤姆.米切尔(Tom Mitchell)在他的经典教材《机器学习》中,给出了更为具体的定义:对于某类任务(Task,简称T)和某项性能评价准则(Performance,简称P),如果一个计算机在程序T上,以P作为性能度量,随着经验(Experience,简称E)的积累,不断自我完善,那么我们称计算机程序从经验E中进行了学习.

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6iOBFwF4-1639661142596)(img/basketball.png)]

例如,篮球运动员投篮训练过程:球员投篮(任务T),以准确率为性能度量(P),随着不断练习(经验E),准确率不断提高,这个过程称为学习.

2. 为什么需要机器学习

1)程序自我升级;

2)解决那些算法过于复杂,甚至没有已知算法的问题;

3)在机器学习的过程中,协助人类获得事物的洞见.

3. 机器学习的形式

1) 建模问题

所谓机器学习,在形式上可近似等同于在数据对象中通过统计、推理的方法,来寻找一个接受特定输入X,并给出预期输出Y功能函数f,即$ Y = f(x)$. 这个函数以及确定函数的参数被称为模型.

2) 评估问题

针对已知的输入,函数给出的输出(预测值)与实际输出(目标值)之间存在一定误差,因此需要构建一个评估体系,根据误差大小判定函数的优劣.

3) 优化问题

学习的核心在与改善性能,通过数据对算法的反复锤炼,不断提升函数预测的准确性,直至获得能够满足实际需求的最优解,这个过程就是机器学习.

4. 机器学习的分类(重点)

1) 有监督、无监督、半监督学习

a) 有监督学习

在已知数据输出(经过标注的)的情况下对模型进行训练,根据输出进行调整、优化的学习方式称为有监督学习.

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RUJ0gygQ-1639661142597)(img/supervised_learning.png)]

####b) 无监督学习

没有已知输出的情况下,仅仅根据输入信息的相关性,进行类别的划分.

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8aq4cxNw-1639661142597)(img/cluster.png)]

####c) 半监督

先通过无监督学习划分类别,再人工标记通过有监督学习方式来预测输出.例如先对相似的水果进行聚类,再识别是哪个类别.

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-63FfaMA2-1639661142597)(img/Semi_supervised.png)]

####d) 强化学习

通过对不同决策结果的奖励、惩罚,使机器学习系统在经过足够长时间的训练以后,越来越倾向于接近期望结果的输出.

2) 批量学习、增量学习

a) 批量学习

将学习过程和应用过程分开,用全部训练数据训练模型,然后再在应用场景中进行预测,当预测结果不够理想时,重新回到学习过程,如此循环.

b) 增量学习

将学习过程和应用过程统一起来,在应用的同时,以增量的方式不断学习新的内容,边训练、边预测.

3) 基于模型学习、基于实例学习

a) 基于模型的学习

根据样本数据,建立用于联系输出和输出的某种数学模型,将待预测输入带入该模型,预测其结果. 例如有如下输入输出关系:

输入(x) 输出(y)
1 2
2 4
3 6
4 8

根据数据,得到模型 y = 2 x y = 2x y=2x

预测:输入9时,输出是多少?

b) 基于实例的学习

根据以往经验,寻找与待预测输入最接近的样本,以其输出作为预测结果(从数据中心找答案). 例如有如下一组数据:

学历(x1) 工作经验(x2) 性别(x3) 月薪(y)
本科 3 8000
硕士 2 10000
博士 2 15000

预测:本科,3,男 ==> 薪资?

5. 机器学习的一般过程(重点)

  1. 数据收集,手段如手工采集、设备自动化采集、爬虫等

  2. 数据清洗:数据规范、具有较大误差的、没有意义的数据进行清理

​ 注:以上称之为数据处理,包括数据检索、数据挖掘、爬虫…

  1. 选择模型(算法)

  2. 训练模型

  3. 模型评估

  4. 测试模型

​ 注:3~6步主要是机器学习过程,包括算法、框架、工具等…

  1. 应用模型

  2. 模型维护

6. 机器学习的典型应用

  1. 股价预测

  2. 推荐引擎

  3. 自然语言处理

  4. 语音处理:语音识别、语音合成

  5. 图像识别、人脸识别

  6. ……

7. 机器学习的基本问题(重点)

1) 回归问题

根据已知的输入和输出,寻找某种性能最佳的模型,将未知输出的输入代入模型,得到**连续的输出**.例如:

  • 根据房屋面积、地段、修建年代以及其它条件预测房屋价格
  • 根据各种外部条件预测某支股票的价格
  • 根据农业、气象等数据预测粮食收成
  • 计算两个人脸的相似度

2) 分类问题

根据已知的输入和输出,寻找性能最佳的模型,将未知输出的输入带入模型,得到**离散的输出**,例如:

  • 手写体识别(10个类别分类问题)
  • 水果、鲜花、动物识别
  • 工业产品瑕疵检测(良品、次品二分类问题)
  • 识别一个句子表达的情绪(正面、负面、中性)

3) 聚类问题

根据已知输入的相似程度,将其划分为不同的群落,例如:

  • 根据一批麦粒的数据,判断哪些属于同一个品种
  • 根据客户在电商网站的浏览和购买历史,判断哪些客户对某件商品感兴趣
  • 判断哪些客户具有更高的相似度

4) 降维问题

在性能损失尽可能小的情况下,降低数据的复杂度,数据规模缩小都称为降维问题.

8. 课程内容

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-FMeQpBhK-1639661142597)(img/ML_summary.png)]

三、数据预处理

1. 数据预处理的目的

1)去除无效数据、不规范数据、错误数据

2)补齐缺失值

3)对数据范围、量纲、格式、类型进行统一化处理,更容易进行后续计算

2. 预处理方法

1)标准化(均值移除)

让样本矩阵中的每一列的平均值为0,标准差为1. 如有三个数a, b, c,则平均值为:

m = ( a + b + c ) / 3 a ′ = a − m b ′ = b − m c ′ = c − m m = (a + b + c) / 3 \\ a' = a - m \\ b' = b - m \\ c' = c - m m=(a+b+c)/3a=amb=bmc=c

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值