视频一——机器学习动机与应用笔记
.1.介绍
梯度下降法是求解无约束优化问题的一种方法,在最优化理论里面也叫最速下降法。属于监督式学习方法的一种。
基于给定的样本,通过有效的函数模型让样本得到有效的拟合(直线或曲线或者曲面等),模型函数依据经验判断。函数的相关参数值通过训练获得。依次对未来的数据进行预测。
2.应用环境
可解决分类问题与回归问题,其中回归问题为预测的值是连续的,分类问题预测的值是离散的,例如预测房价属于回归问题。预测癌症是良性或者恶性的属于分类问题。变量可能为多个,例如依据年龄与肿瘤大小预测癌症的良性或者恶性,如下图可能需要确定一条直线进行分类。
3.延伸
若为三维、四维甚至无限中特性空间中,可用支持向量机方法来实现。支持向量机方法可以处理无限种特性。
无监督学习方法,样本没有确切的答案,自行寻找规律,如聚类方法,照片自动分区,设备网络分析,市场分析。
强化学习:直升飞机飞行,利用强化学习方法,很难直接写程序进行控制。每次做的好,得到表扬,做的不好会批评,时间长了,学会怎么表现好点。回报函数,强化学习的关键是找到一种方式来定义你想要什么,定义一种好的行为与坏的行为。一种学习方法尽量获得更多的表扬与少的批评。强化学习被大量用在机器的学习上,如机器狗爬行,飞机飞行,爬行蛇爬过障碍物,汽车高速行驶并通过障碍物等。