优化是机器学习的核心

作者:chen_h
微信号 & QQ:862251340
微信公众号:coderpai


优化是数据科学中几乎所有机器学习和统计技术的核心。今天我们讨论一下最流行的机器学习/统计建模方法背后的核心优化框架。

介绍

通常,数据科学和机器学习的新人,我们都会要求他们去学习尽可能多的统计学知识和线性代数。在这两个学科中建立扎实的基础,这对后期学习各种数据科学和机器学习都是非常有好处的。然而,我们在学习的过程中多会有意无意的忽略优化的重要性。说的客气一点,如果不能很好的理解这个问题,我们对一整个数据科学世界的理解都是不完整的。这是因为优化是每个主要业务,社会,经济的核心,而且,我敢说,个人决策,集体决策有时候都会是一个优化的结果。

日常的例子

在日常生活中,其实你始终在优化变量并且用于你的个人决策,但在大部分时间你是没有意识到这个过程的,比如如下场景:

  • 安排如何查看电子邮件;
  • 切换回家的新路线,以尽量减少交通问题;
  • 试图安排一个短暂的散步时间;

这些听起来是不是都很有趣,这些都是我们平时接触到的,但都不会认为我们是去优化了它们。

这些看似个人的决定,但是每一个都可以使用冷酷而又优美的数学模型来精确建模,我们的大脑是一个惊人的优化器,可以整天解决这些复杂的计算问题。

那么,接下来让我们聊聊数据科学的优化问题…

优化对数据科学有多重要?

非常重要!!!!!!

基础科学,商业决策和工程问题长期以来一直都是在使用优化和方法。从这个意义上来讲,几乎每种工程产品都是一种紧凑的物理形态的优化问题。工程师经过专门培训,可以在资源有限的情况下工作,并从不完整或者嘈杂的数据中生成“足够好”的解决方案。基本上它们每天都可以通过计算机,半导体IC,熔炉或者内燃机来解决优化问题。商业组织也是如此。事实上,每项业务决策都是为了在时间,预算,空间以及法律和道德界限的约束下最大化某种形式的收益(例如利润率或者知识产权领导力)。这些都是某种形式的优化问题。

今天,几乎所有的商业问题和技术都是都受到数据科学和机器学习的影响。然而,这并没有改变基于自然资源和人力资源有限的现实,一天还是 24 小时,物理空间还是一整个地球。法律和道德的界限也没有很快消失。

人工智能或者机器学习的先进技术可能能够知道企业以更快的速度获得更好的最佳解决方案,但是他们必须面对和解决与之前相同的优化问题。大量的新数据将有助于这个过程,但是随着时间的推移,预期也会增长。

举个例子,如果在过去,工程团队可以获得 1GB 的数据并且可以以 10 美元的成本生成最佳解决方案,那么如果给到优化团队,他们预计的成本将减低到 7 美元,数据的丰富度将为 10 GB。否则,大数据有什么意义?(画外音:要你何用!!!)

因此,对于数据科学/机器学习从业者来说,掌握优化框架的理论基础,用于常见的统计/机器学习算法,这是至关重要的:

  • 如何有效的使用数据;
  • 如何估算处理大数据集的计算量;
  • 如何避免局部最小值并从复杂的多维空间中寻找到一个好的解决方案。

优化的基本要素

任何优化问题都有三个基本要素:

  • 变量:这些算法都是可以自由调整参数的;
  • 约束:这些是参数必须控制的边界;
  • 目标函数:这些算法驱动解决方案的目标集。对于机器学习,通常这相当于最小化一些损失值。

本文的其余部分将重点介绍一些基础的,广泛使用的统计模型和ML算法,并在上述元素展示其核心的优化框架。

简单线性回归

在这里插入图片描述

此外,从两个角度来看,回归中注意以下区别:

在这里插入图片描述

正则线性回归

在这里插入图片描述

逻辑回归

在这里插入图片描述

SVM

在这里插入图片描述

时间序列分析 —— 指数平滑

在这里插入图片描述

时间序列分析 —— ARIMA

在这里插入图片描述

K-meas

在这里插入图片描述

深度学习/神经网络

大多数神经网络通过反向传播技术优化神经元之间的链接权重,采用先进的优化方法来确保找到具有高收敛概率的良好解决方案。

在这里插入图片描述

强化学习

强化学习目前变成了现代 AI 系统的一个核心。如果你听说过谷歌著名的 AlphaGo 计划,他在古老的棋盘游戏 Go 中击败了人类的最好选手,你可以认为,一些真正先进的机器智能背后都是优化策略。

一点点小激动——利用机器学习进行优化

可能存在激动人心的优化问题,这些问题使用机器学习来作为前端来创建模型和目标函数,这与其他方法相比,可以更快的评估/计算模型/目标函数。当然,这与本文的主要讨论点不同。但是,尽管如此,一般来说,优化和机器学习之间存在着复杂的相互作用。

作为说明,优化框架中的更新公式(例如,在梯度下降中)可以使用神经网络来替代复杂的函数。

这个方法的一个应用功能是通过优化循环中的机器学习映射函数来替代耗时的仿真模型,其中数千个输入变量被反馈到仿真模型中,我们希望以某种方式找到优化的参数集的最佳模拟输出。这个想法如下图所示:

在这里插入图片描述

总结和其他方法

在本文中,我们讨论了优化在现代商业和工程企业中的一般作用,以及为什么了解它对数据科学变得至关重要。我们展示了基本优化模型,它是一些广泛流行的统计技术和机器学习算法的核心。通过一些简单的搜索,你会发现类似的优化框架是其他流行的 ML 方法的核心,例如:

  • EM 算法
  • 梯度类算法
  • GA算法
  • 仿真测试
  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
众所周知,人工智能是当前最热门的话题之一, 计算机技术与互联网技术的快速发展更是将对人工智能的研究推向一个新的高潮。 人工智能是研究模拟和扩展人类智能的理论与方法及其应用的一门新兴技术科学。 作为人工智能核心研究领域之一的机器学习, 其研究动机是为了使计算机系统具有人的学习能力以实现人工智能。 那么, 什么是机器学习呢? 机器学习 (Machine Learning) 是对研究问题进行模型假设,利用计算机从训练数据中学习得到模型参数,并最终对数据进行预测和分析的一门学科。 机器学习的用途 机器学习是一种通用的数据处理技术,其包含了大量的学习算法。不同的学习算法在不同的行业及应用中能够表现出不同的性能和优势。目前,机器学习已成功地应用于下列领域: 互联网领域----语音识别、搜索引擎、语言翻译、垃圾邮件过滤、自然语言处理等 生物领域----基因序列分析、DNA 序列预测、蛋白质结构预测等 自动化领域----人脸识别、无人驾驶技术、图像处理、信号处理等 金融领域----证券市场分析、信用卡欺诈检测等 医学领域----疾病鉴别/诊断、流行病爆发预测等 刑侦领域----潜在犯罪识别与预测、模拟人工智能侦探等 新闻领域----新闻推荐系统等 游戏领域----游戏战略规划等 从上述所列举的应用可知,机器学习正在成为各行各业都会经常使用到的分析工具,尤其是在各领域数据量爆炸的今天,各行业都希望通过数据处理与分析手段,得到数据中有价值的信息,以便明确客户的需求和指引企业的发展。
### 回答1: 增强学习(Reinforcement Learning)是机器学习的一个分支,它的目标是让智能体(Agent)通过不断地与环境交互,从而学习最优策略来达成特定的目标。在增强学习中,智能体通过观察环境状态、执行动作以及接收奖励来学习最优策略。智能体的目标是最大化长期奖励,而不仅仅是在当前状态下获得即时奖励。增强学习在机器人控制、游戏AI、自动驾驶等领域有着广泛的应用。 ### 回答2: 增强学习是机器学习中的一种方法,着重于通过智能体与环境的交互来学习最佳行为策略。在增强学习中,智能体通过与环境进行连续的互动,通过尝试不同的行动并根据环境的反馈来学习和优化其行为。 增强学习的目标是让智能体通过尝试不同的行动,获得最大的长期回报。智能体在每个时间步骤中观察环境的状态,然后根据当前的状态选择一个行动来执行。环境会根据智能体的行动反馈一个奖励信号,用于评估这个行动的好坏。智能体会根据得到的奖励信号来更新自己的行为策略,以实现更好的长期回报。 在增强学习中,智能体通过试错的方式逐渐学习到最佳的行为策略。通过与环境的交互,智能体可以通过学习从过去的经验中总结出对于给定状态下选择最佳行动的规律,并根据这些规律来做出决策。增强学习算法不需要人为提供标注的训练数据,智能体能够在不断尝试中自我调整和优化其行为。 增强学习在许多领域中都有广泛的应用,例如智能游戏、自动驾驶、机器人控制等。通过增强学习,机器可以在与环境的交互中进行学习和决策,从而不断提升其性能和效果。增强学习是一种强大的机器学习方法,能够让机器在没有明确指导的情况下自主学习和改进,为人工智能的发展提供了重要的途径。 ### 回答3: 机器学习的增强学习是一种机器学习方法,其目标是通过与环境的交互来让机器智能地学习并自主做出决策。在增强学习中,机器学习系统被称为智能体(agent),它通过观察环境的状态来选择相应的动作,然后根据这些动作的结果来调整自己的策略,以获得最大的奖励或最小的惩罚。 在增强学习中,智能体与环境之间的交互是通过一系列离散的时间步骤来进行的。在每个时间步骤中,智能体观察到当前的状态,并选择一个动作来执行。然后,环境根据智能体的动作和当前状态,转移到一个新的状态,并反馈给智能体一个奖励或惩罚,以反映动作的好坏。智能体根据这个反馈来学习,通过试错的方式逐渐调整自己的策略,以最大化总的奖励。 增强学习的核心思想是基于试错学习的奖励机制。通过与环境的交互,智能体可以从不同的尝试中学习到不同的策略,并根据奖励或惩罚的反馈来调整策略的优劣。这种自我调整的过程是增强学习的关键特点,使得机器能够从实践中积累经验,并逐渐提高在复杂环境中的表现能力。 总而言之,增强学习是一种通过与环境交互的机器学习方法,智能体通过试错的方式不断优化自己的策略,以获得最大的奖励或最小的惩罚。这种学习方法在自动驾驶、智能游戏和机器人控制等领域具有广泛的应用前景。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值