机器学习概论

本文探讨了人工智能的三大关键概念——人工智能、机器学习和深度学习之间的关系,强调了数据、算法和算力作为AI发展的基石。文章还讨论了机器学习的不同类型(如过拟合、欠拟合),数据集划分,以及监督、无监督和强化学习的分类。
摘要由CSDN通过智能技术生成

人工智能三大概念:
人工智能(AI)是研究合成与分析的一 个领域(仿智)使用计算机来模拟或代替人类
机器学习(ML)让计算机无需显式编程就能学习的研究领域
深度学习(DL)深度神经网络,大脑仿生,设计一层一层的设计神经元模拟万事万物
三者之间的关系:人工智能>机器学习>深度学习

  • 人工智能、机器学习、深度学习三者可以被简单描述为嵌套关系

  • 机器学习时实现人工智能的方法,深度学习时实现机器学习的方法

机器学习是实现人工智能的一种途径
深度学习是机器学习的一种方法
学习方式:
基于规律的学习:程序员根据经验利用手工的if-else进行预测
基于模型的学习:从数据中自动学出规律
基于模型的学习:比如房价预测
机器学习的应用领域:
图像识别,无人驾驶,智能翻译,医疗智能翻译,数据挖掘

图像识别与计算机视觉

图像识别和计算机视觉是另一个重要的机器学习应用领域,它使计算机能够理解和解释图像。深度学习模型如卷积神经网络(CNN)在图像分类、目标检测等任务中取得了突破性进展。以下是一个使用TensorFlow的简单图像分类示例:

在这里插入图片描述

. 医疗诊断与影像分析

机器学习在医疗领域有着广泛的应用,包括医疗图像分析、疾病预测、药物发现等。深度学习模型在医疗影像诊断中的表现引人注目。以下是一个使用PyTorch的医疗图像分类示例:

在这里插入图片描述

在这里插入图片描述

AI发展三要素:
数据,算法,算力三要素相互作用,是AI发展的基石

人工智能(AI)的快速发展依赖于三个核心要素:数据,算法,算力。这个观点已经得到了业界的高度认可。只有这三个要素同时满足了,才能加速人工智能的大发展。

0827dc22fc454491b92c093b4a06cac8.png

人工智能发展史
1956年人工智能元年
2012年计算机视觉深度神经网络方法研究兴起,
2017年自然语言处理应用大幕拉开
2022年chatGPT的出现,引起AIGC的发展
机器学习常用术语:

1)拟合
形象地说,“拟合”就是把平面坐标系中一系列散落的点,用一条光滑的曲线连接起来,因此拟合也被称为“曲线拟合”。拟合的曲线一般用函数进行表示,但是由于拟合曲线会存在许多种连接方式,因此就会出现多种拟合函数。通过研究、比较确定一条最佳的“曲线”也是机器学习中一个重要的任务。如下图所示,展示一条拟合曲线(蓝色曲线):

2) 过拟合
过拟合(overfitting)与是机器学习模型训练过程中经常遇到的问题,所谓过拟合,通俗来讲就是模型的泛化能力较差,也就是过拟合的模型在训练样本中表现优越,但是在验证数据以及测试数据集中表现不佳。

举一个简单的例子,比如你训练一个识别狗狗照片的模型,如果你只用金毛犬的照片训练,那么该模型就只吸纳了金毛狗的相关特征,此时让训练好的模型识别一只“泰迪犬”,那么结果可想而知,该模型会认为“泰迪”不是一条狗。如下图所示:
过拟合问题在机器学习中经常原道,主要是因为训练时样本过少,特征值过多导致的,后续还会详细介绍。

3) 欠拟合
欠拟合(underfitting)恰好与过拟合相反,它指的是“曲线”不能很好的“拟合”数据。在训练和测试阶段,欠拟合模型表现均较差,无法输出理想的预测结果。如下图所示:

造成欠拟合的主要原因是由于没有选择好合适的特征值,比如使用一次函数(y=kx+b)去拟合具有对数特征的散落点(y=log2x),示例图如下所示:

数据集划分:训练集用来训练模型、测试集用来测试评估模型。
机器学习算法分类:


有监督学习:有标签。目标值连续:回归;目标值回归:分类
无监督学习:无标签,根据样本的特征进行聚类
半监督学习:一半有标签,一半无标签
强化学习:通过构建四个要素:agent,环境状态,行动,奖励,
               agent根据环境状态进行行动获得最多的累计奖励。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值