NG课程学习笔记一

视频一——机器学习动机与应用笔记

.1.介绍    

梯度下降法是求解无约束优化问题的一种方法,在最优化理论里面也叫最速下降法。属于监督式学习方法的一种。

基于给定的样本,通过有效的函数模型让样本得到有效的拟合(直线或曲线或者曲面等),模型函数依据经验判断。函数的相关参数值通过训练获得。依次对未来的数据进行预测。

2.应用环境

可解决分类问题与回归问题,其中回归问题为预测的值是连续的,分类问题预测的值是离散的,例如预测房价属于回归问题。预测癌症是良性或者恶性的属于分类问题。变量可能为多个,例如依据年龄与肿瘤大小预测癌症的良性或者恶性,如下图可能需要确定一条直线进行分类。


3.延伸

若为三维、四维甚至无限中特性空间中,可用支持向量机方法来实现。支持向量机方法可以处理无限种特性。

无监督学习方法,样本没有确切的答案,自行寻找规律,如聚类方法,照片自动分区,设备网络分析,市场分析。

强化学习:直升飞机飞行,利用强化学习方法,很难直接写程序进行控制。每次做的好,得到表扬,做的不好会批评,时间长了,学会怎么表现好点。回报函数,强化学习的关键是找到一种方式来定义你想要什么,定义一种好的行为与坏的行为。一种学习方法尽量获得更多的表扬与少的批评。强化学习被大量用在机器的学习上,如机器狗爬行,飞机飞行,爬行蛇爬过障碍物,汽车高速行驶并通过障碍物等。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值