人工智能三大概念
人工智能(AI)、机器学习(ML)和深度学习(DL)
◆机器学习的应用领域和发展史
◆机器学习常用术语样本、特征、标签、训练集和测试集
◆机器学习算法分类有监督学习、无监督学习、半监督、强化学习
◆机器学习建模流程
◆特征工程概念入门特征工程、特征工程子领域
◆模型拟合问题◆机器学习开发环境
什么是人工智能?
人工智能(Artificial Intelligence,简称AI )是一门研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的新技术科学。它是计算机科学的一个分支,旨在理解和复制智能的本质,并生产出能够以人类智能相似的方式做出反应的智能机器。人工智能的研究领域包括机器人、语言识别、图像识别、自然语言处理、专家系统、机器学习和计算机视觉等。
深度学习
•深度学习(DL, Deep Learning):,也叫深度神经网络,大脑仿生,设计一层一层的神经元模拟万事万物
AI发展三要素
•数据、算法、算力三要素相互作用,是AI发展的基石
有监督学习&无监督学习
有监督学习
◆定义:输入数据是由输入特征值和目标值所组成,即输入的训练数据有标签的
◆数据集:需要标注数据的标签/目标值
无监督学习
◆定义:输入数据没有被标记,即样本数据类别未知,没有标签,根据样本间的相似性,对样本集聚类,以发现事物内部结构及相互关系。
◆数据集:不需要标注数据
无监督学习特点:1训练数据无标签2根据样本间的相似性对样本集进行聚类,发现事物内部结构及相互关系
半监督学习工作原理:
1让专家标注少量数据,利用已经标记的数据(也就是带有类标签)训练出一个模型
2再利用该模型去套用未标记的数据
3通过询问领域专家分类结果与模型分类结果做对比.
半监督学习方式可大幅降低标记成本
机器学习算法分类–强化学习
1强化学习(Reinforcement Learning):机器学习的一个重要分支
2应用场景:里程碑AlphaGo围棋、各类游戏、对抗比赛、无人驾驶场景
3基本原理:通过构建四个要素:agent,环境状态,行动,奖励,agent根据环境状态进行行动获得最多的累计奖励。
1按照学习方式分类可分为:监督学习,无监督学习,半监督学习,强化学习
2监督学习:输入训练集数据包含输入特征值和目标值回归:函数的输出是一个连续的值分类:函数的输出是有限个离散值
3无监督学习:输入训练集数据是由输入特征值组成,没有目标值比如:聚类根据样本间的相似性对样本集进行分类
4半监督学习:训练集同时包含有目标值的样本数据和不含有目标值的样本数据
5强化学习:智能体不断与环境进行交互,通过获取最大奖励的方式(试错的方式)来获得最佳策略;主要包含四个元素:Agent(智能体),环境(Environment),行动(Action),奖励(reward)