深度学习入门-简介

#最近开始看沐神的《动手学深度学习》,陆续记录学习笔记#

机器学习的四大关键组件

  • 数据 :机器学习的输入,数据集由多个样本组成,每个样本可以包含一组特征(属性);通常情况下,数据量越大,训练得到的模型也更加强大;同时,数据要求正确且客观,错误的数据只能得到错误的模型,不具备充分代表性的数据会训练出有偏见的模型
  • 模型 :将输入数据转换为需要的输出内容的方法
  • 目标函数 :用于评估一个模型的优劣程度,通常定义一个目标函数,并希望优化到最低点,因此又被称为损失函数(Loss function)
  • 优化算法 : 用于搜索出模型的最佳参数,最小化损失函数,通常基于梯度下降

一个典型的机器学习训练过程

机器学习问题

监督学习 :在“给定输入特征”的情况下预测标签

  • 回归(regression) :“有多少”问题。当标签取任意值的时候,要求模型的预测非常接近实际标签值。通常损失函数为平方误差。

  • 分类(classification) :“是什么”问题。训练一个分类器来输出预测的类别。通常损失函数为交叉熵。

  • 标记问题 多标签分类(multi-label classification):学习预测不相互排斥的类别。(例如:为一篇文章添加tags)

  • 搜索 :学习算法需要输出有序的元素子集

  • 推荐系统(recommender system) :向特定用户进行“个性化”推荐

  • 序列学习 :模型输入是连续的,模型拥有“记忆”功能,例如:语音、视频、文本。
    常见的应用场景:
    1)标记和解析:使用属性注释文本序列。通常基于结构和语法假设对文本进行分解和注释,例如:注释一个句子的主语、谓语等。
    2)自动语音识别:输入录音,输出录音对应的文本
    3)文本到语音:输入是文本,输出是音频文件
    4)机器翻译:将一种语言翻译为另一种

无监督学习 :输入数据中不含有“目标”

  • 聚类问题(clustering) :无标签情况下,数据分类
  • 主成分分析问题(principal component analysis) :找到少量参数来准确的捕捉数据的线性相关属性
  • 因果关系(causality)和概率图模型(probabilistic graphical models)问题:描述观察到的许多数据的根本原因,例如,关于房价、污染、地理位置、教育、工资和人口统计数据,是否能根据经验数据发现它们之间的关系
  • 生成对抗性网络(generative adversarial networks):提供一种合成数据的方法

与环境互动 :无需准备大量数据作为输入,而是实时从真实环境中收集数据用于建模

强化学习 :智能体在一系列时间步骤上与环境交互,最终生成一个好的策略

在每个特定时间点,智能体从环境接收一些观察数据,并必须选择一个动作,然后通过执行器传输到环境中,最后智能体在环境中获得奖励,开启新一轮循环。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值