Day1:机器学习

本文概述了人工智能中的三大关键概念——人工智能、机器学习和深度学习,介绍了它们之间的关系以及机器学习在计算机视觉、自然语言处理等领域的应用。文章详细阐述了AI发展所需的数据、算法和算力支持,涵盖了机器学习的常用术语、分类方法以及建模流程,包括数据获取、预处理、特征工程和模型评估等环节。
摘要由CSDN通过智能技术生成

一     人工智能三大概念

1.人工智能(Arificial Intelligence)概念

用计算机模拟或替代人的大脑。(AI的期望就是像人一样的系统)

2.机器学习(Machine Leaning)概念

即根据已知数据训练模型预测未知数据。(机器自动学习,不基于规则编程)

3.深度学习(Deep Learning)概念

也叫深度神经网络,大脑仿生。

4.关系

机器学习是实现人工智能的一种途径,深度学习是机器学习的一种。

5.算法的学习方式

基于规则的学习和基于模型的学习

二   机器学习的应用领域和发展史

1.机器学习的应用领域

计算机视觉CV:对人看到的东西进行理解

自然语言处理:对人交流的东西进行理解

数据挖掘和数据分析:也属于人工智能的范畴

2.AI发展三要素

数据(输入算法),算法,算力(支撑算法)

CPU:主要适合I/O密集型的任务

GPU:主要适合计算密集型的任务

TPU:专门针对大型网络训练而设计的一款处理器

三   机器学习常用术语

 样本:一行数据就是一个样本;多个样本组成数据集;又是一条样本也被叫做一条记录。

特征:一列数据一个特征,有时也被称为属性。

标签/目标:模型要预测的那一列数据。

注:特征是从数据中抽取出来的对结果预测有用的信息。

数据集可划分为:训练集和测试集(比例:8:2,7:3)

训练集:用来训练模型的数据集

测试集:用来测试模型的数据集

四   机器学习算法分类

1.机器算法按照学习方式分类:监督学习,无监督学习,半监督学习,强化学习
2.监督学习:

   定义:输入数据是由输入特征值和目标值所组成的,即输入的训练数据有标签的

   数据集:需要标注数据的标签/目标值

   分类问题目标值是不连续的,回归问题目标值是连续的。
 2.无监督学习:

     定义:输入数据没有被标记,即样本数据类别未知,没有标签,根据样本间的相似性,对样本集聚类,以发现事物内部结构及相互关系。

     无目标值

3.半监督学习:

    训练集同时包含有目标值的样本数据和不含有目标值的样本数据

4.强化学习:

    智能体不断与环境进行交互,通过获取最大奖励的方式(试错的方式)来获得最佳策略。主要包含四个要素:Agent(智能体),环境(Environment),行动(Action),奖励(Reward)

五    机器学习建模流程

1.获取数据

   搜集与完成机器学习任务相关的数据集

2.数据基本处理

  数据集中异常值,缺失值的处理等

3.特征工程

 对数据特征进行提取,转成向量,让模型达到最好的效果

4.机器学习(模型训练)

  根据不同的任务来选中不同的算法,有监督学习,无监督学习,半监督学习,强化学习

5.模型评估 

  评估效果好上线服务,评估效果不好则重复上述步骤

  • 8
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值