机器学习是一种人工智能的分支,通过构建和训练模型,使计算机能够从数据中学习和提取规律,从而进行预测,识别,分类等任务。
一. 人工智能三大概念
1.人工智能
Artificial Intelligence,简称AI:仿智,使用计算机来模拟或者代替人类。
2.机器学习
Machine Learning,简称ML:机器自动学习,不基于规则编程。
3.深度学习
Deep Learning,简称DL:也叫深度神经网络,大脑仿生,设计一层一层的神经元模拟万事万物。
三者之间的关系如下:
机器学习是实现人工智能的一种途径,
深度学习是机器学习的一种方法。
4.算法的学习方式
(1)基于规则的学习:程序员根据经验利用手工的if-else方式进行预测。如:图像和语言识别和 自然语言处理等。
(2)基于模型的学习:从数据中自动学出规律。如:房价预测等。
二.机器学习的应用领域和发展史
1.机器学习的应用领域
可用于计算机视觉cv领域(对人们看到的东西进行理解);自然语言处理领域(对人们交流的东西进行理解);数据发掘和数据分析领域(属于人工智能范畴)等等。
2.人工智能发展史
1956年:人工智能元年
2012年:计算机视觉深度神经网络方法研究兴起
2017年:自然语言处理应用大幕拉开
2022年:chatGPT的出现,引起AIGC的发展
3.人工智能发展三要素
数据,算法,算力
三.机器学习常用术语
1.样本和数据集
样本(sample):一行数据就是一个样本。多个样本组成数据集;有时一条样本叫做一条记录。
数据集(dataset):多个样本组成数据集。
2.特征
特征(feature):一列数据一个特征,有时也被称为属性。从数据中抽取出来的,对结果预测有 用的信息。
3.标签
标签/目标(label/target):模型要预测的那一列数据。
4.数据集划分
训练集用来训练模型,测试集用来测试评估模型。一般划分比例为7:3 或8:2。
四.机器学习算法分类
1.有监督学习:对于训练集的数据而言,其有特征有标签。一般可根据目标值的状态分为分类任务 和回归任务。若目标值离散,则为分类任务;若目标值连续,则为回归任务。
2.无监督学习:对于训练集的数据而言,其有特征无标签。根据样本间的相似性对样本集进行聚 类,发现事物内部结构及相互关系。
3.半监督学习:对于训练集的数据而言,部分有标签,部分无标签。利用有标签的数据训练出的模 型来预测无标签的数据的标签。
4.强化学习:机器学习的一个重要分支。应用于各类游戏,对抗比赛,无人驾驶场景等,通过构建 四个基本要素:agent,环境状态,行动,奖励来实现强化学习,agent根据环境状 进行行动获得最多的累计奖励。
五.机器学习建模流程
1.机器学习建模的一般步骤
(1)获取数据:收集与完成机器学习任务相关的数据集。如图像数据和文本数据等。
(2)数据基本处理:数据集中异常值,缺失值的处理等。
(3)特征工程:对数据特征进行提取,转成向量,让模型达到最好效果。如特征提取,特征预处 理,特征降维等。
(4)机器学习/模型训练:根据不同的任务来选定合适的算法对模型进行训练。
(5)模型评估:评估效果好则上线服务,不好则重复上述步骤。可根据回归评测指标,分类评测 指标,聚类评测指标等来进行评估。
通过认知实习第一天的学习,我了解并掌握了机器学习的相关基本内容,并认识到了机器学习在本专业课程学习与技能掌握中占有中重要地位,在以后的学习过程中,我会更加重视机器学习,好好学习,天天向上!