机器学习实战笔记

机器学习实战笔记

机器学习的概念:

引用Andrew Ng在机器学习课程中说过的一句话“机器学习实际上就是使用一个学习型算法,让机器学习起来”。机器学习能让我们自数据集中受到启发,换句话说,我们会利用计算机来彰显数据背后的真是含义。

实际上,很多应用是很难用程序编写出来的,或者说不能编写出来的,例如手写体识别问题。而借助于机器学习的思想,我们能够挖掘数据背后隐含的特征,从而能够解决该问题。

学习方式:

监督学习:分类(离散)和回归(连续)属于监督学习,之所以称之为监督学习,是因为这类算法必须知道预测什么,即目标变量的分类信息(可理解为:给算法提供了一组“标准答案”,即有标签的训练集,输出结果也会是“标准答案的形式”)。

无监督学习:数据没有类别信息,也不会给定目标值(可理解为:给一组数据,不告诉你关于数据任何的“标准答案”,要求你从中找出一些有趣的结构,而不用给出任何的“标准答案”)。在无监督学习中,将数据集合分成由类似的对象组成的多个类的过程被称之为聚类;将寻找描述数据统计值的过程称之为密度估计。此外,无监督学习还可以减少数据特征的唯独,以便我们可以使用二维或三维图形更加直观地展示数据信息。

必须要明确一点的是,在很多实际问题中,只有少量的带有标记的数据,因为对数据进行标记的代价有时比利用它们还要高,比如在生物学中,对某种蛋白质的结构分析或者功能鉴定,可能会花上生物学家很多年的工作,而大量的未标记数据却很容易得到。

         半监督学习:半监督学习是监督学习和无监督学习的结合。在此学习方式下,输入数据部分被标识,部分没有被标识,这种学习模型可以用来进行预测,但是模型首先需要学习数据的内在结构以便合理地组织数据来进行预测。

         强化学习:所谓强化学习就是智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大,强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作好坏的一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。常见的应用场景包括动态系统以及机器人控制等。

强化学习示例图

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值