机器学习简述

机器学习的关键在于选择合适的训练经验,包括直接和间接反馈的学习,以及控制训练样例序列的能力。学习器需要能够从反馈中学习,并在无法完全控制训练样例时适应。训练样例的分布应能准确反映实例分布,以确保学习的泛化能力。当训练与测试分布不一致时,学习的挑战性增加。
摘要由CSDN通过智能技术生成

机器学习(机器学习)是研究计算机如何模拟或实现的学习行为,以获取新的知识或技能,重新组织组织的知识结构使其不断提高自身的性能。它是人工智能的人类的核心,是使人类的核心具有自动驾驶的主要途径,其应用其应用的机器不同领域,不同的人工智能和人工智能有效帮助。搜索,并提高了人类的基因认识。而不是定期,你可能会使用多次自知。非常大很多人也认为这是最好的人工智能取得。本课中,您将学习最实用的学习技术,并获得实践,它们为自己的工作。更重要的是,您将使学习成为有效的理论基础,并且获得那些需要快速和强大的应用技术解决方案的实用技术。

例如选择训练经验

我们面临的第一个设计问题是选择训练经验的类型,使系统从中进行学习。给学3器隧供的训练经验对它的成败有重大的影响。--个关键属性是训练经验能否为系统的决策提供真接或间接的反馈。例如 ,对于学习下西洋跳棋,系统可以从直接( direct)的训练样例,即各种棋盘状态和相应的正确走子中学习。另一种情况,它可能仅有间接( indirect)的信息,包含很多过去对弈的走子序列和最终结局。对于后一种情况.对弈中较早走子的正确性必须从对弈最终的输赢来描断。这时学习器又面临·-个信用分配问题,也就是考虑每–次走子对最终结果的贡献程度。信用分配可能是-个非常难以解决的问题,因为如果后面下得很差,那么即使起初的走子是最佳的,这盘棋也会输掉。所以,从直接的训练反馈学习要比从间接反馈学习容易。
我们面临的第一个设计问题是选择训练经验的类型,使系统从中进行学习.给学3器隧供的训练经验对它的成败有重大的影响.--个关键属性是训练经验能否为系统的决策提供真接或间接的反馈。例如,对于学习下西洋跳棋,系统可以从直接(直接)的训练样例,即各种棋盘状态和相应的正确走子中学习.另一种情况,它可能仅有间接(间接)的信息,包含很多过去对弈的走子序列和最终结局.对于后一种情况.对弈中较早走子的正确性必须从对弈最终的输赢来描断.这时学习器又面临·-个信用分配(信用分配)问题,也就是考虑每-次走子对最终结果的贡献程度.信用分配可能是-个非常难以解决的问题,因为如果后面下得很差,那么即使起初的走子是最佳的,这盘棋也会输掉.所以,从直接的训练反馈学习要比从间接反馈学习容易.
训练经验的第二个重要属性是学习器可以在多大程度上控制训练样例序列。例如,学习器可能依赖施教者选取的棋盘状态和所提供的每一次王确移动;或者,学习器可能自心提出它发现的特别困惑的棋局并向饿教者询问正确的走子;或者.学习器可以完全控制棋局和(间接的)训练分类,就像没有施教者时它和自己对弈进行学习一样。注愈,对于最后一种情况,学习器町能选择以下两种情况中的一种:第一,试验它还未考虑过的全新棋局;第二,在它剧前发现的最有效的路线的微小变化上对弈,以磨砺它的技能。后续的章节考虑一些学习框袈,包括了训练经验是以超乎学习器控制的随机过程提供的;学习器可向施教者提出不同类型的在询;以及学对器通过自动探索环境来搜集训练样例的情况。
训练经验的第二个重要属性是学习器可以在多大程度上控制训练样例序列.例如,学习器可能依赖施教者选取的棋盘状态和所提供的每一次王确移动;或者,学习器可能自心提出它发现的特别困惑的棋局并向饿教者询问正确的走子;或者.学习器可以完全控制棋局和(间接的)训练分类,就像没有施教者时它和自己对弈进行学习一样.注愈,对于最后一种情况,学习器町能选择以下两种情况中的一种:第一,试验它还未考虑过的全新棋局;第二,在它剧前发现的最有效的路线的微小变化上对弈,以磨砺它的技能.后续的章节考虑一些学习框袈,包括了训练经验是以超乎学习器控制的随机过程提供的;学习器可向施教者提出不同类型的在询;以及学对器通过自动探索环境来搜集训练样例的情况.训练经验的第三个重要属性是,训练样例的分布能多好地表示实例分布,通过样例来衡址最终系统的性能P。一般而言,当训练样例的分布和将来的测试祥例的分布相似时,学习具有最大的可信度。对于我们的西洋跳棋学习,性能指标Р是该系统在世界锦标赛上获胜的百分比。如果它的训练经验E仅由和它自己对弈的训练组成,便存在一个明显的危险:这个训练可能不能充分地代表该系统以后被测试时的情形。例如,学习器可能在调练中从未遇到过某些致命的棋局,而它们又非常可能被人类世界冠军采用。实际上,学习的样例通常与最终系统被评佶时的样例有一定差异,学习嚣必须能从中进行学习(举例来说.世界级的西洋跳棋冠军可能不会有兴趣教一个程序下桃》。这的确是一个问题,因为掌握了样例的一种分布,不--定会使它对其他的分布也有好的性能。可以看到很多最新的机器学习理论都是基于训练样例与测试样例分布一致这一假设。尽管我们需要这样的假设以便得到理论结果.但同样必须记住在实嶷中这个假设经常是不成立的。
训练经验的第三个重要属性是,训练样例的分布能多好地表示实例分布,通过样例来衡址最终系统的性能P.一般而言,当训练样例的分布和将来的测试祥例的分布相似时,学习具有最大的可信度.对于我们的西洋跳棋学习,性能指标Р是该系统在世界锦标赛上获胜的百分比.如果它的训练经验E仅由和它自己对弈的训练组成,便存在一个明显的危险:这个训练可能不能充分地代表该系统以后被测试时的情形.例如,学习器可能在调练中从未遇到过某些致命的棋局,而它们又非常可能被人类世界冠军采用.实际上,学习的样例通常与最终系统被评佶时的样例有一定差异,学习嚣必须能从中进行学习(举例来说.世界级的西洋跳棋冠军可能不会有兴趣教一个程序下桃“。这的确是一个问题,因为掌握了样例的一种分布,不--定会使它对其他的分布也有好的性能.可以看到很多最新的机器学习理论都是基于训练样例与测试样例分布一致这一假设.尽管我们需要这样的假设以便得到理论结果.但同样必须记住在实嶷中这个假设经常是不成立的.
 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值