- 传统方法是亲手设计一个函数,从分析问题开始,根据编写计算机代码来识别特征,并可靠地生成结果;机器学习采用完全不同的方法,不需要手动设计函数,而是允许计算机根据数据学习自己的函数。
- 线性模型(感知器)
- y=Mx+b
- M是一个矩阵/权重,b是一个向量
- 局限性大,不适合大多数实际的数据集。当数据维度变得非常高时,问题会变得更糟。
- 多层感知器(MLP)
- 可以简单理解为将多个线性变换一个接一个地叠加起来。
- 将一个线性函数传递给另一个非线性函数(激活函数φ(x))
- y=M2φ(M1x+b1)+b2
- 还可以把任意多个变换堆在一起:
- h1=φ1(M1x+b1)
- h2=φ2(M2h1+b2)
- ...
- hn-1=φn-1(Mn-1hn-2+bn-1)
- y=φn(Mnhn-1+bn)
- 目前比较流行的激活函数有三种:
- 修正线性单元函数
- 双曲正切函数
- sigmoid函数
- MLP的另外两个属性:宽度与深度
- 定义
- 宽度:指隐藏层的大小,选择每个hhhh的长度
- 深度:指模型中的层数
- 宽度与深度的选择需要尝试多个组合,有一些原则可以提供指导:
- 包含一个隐含层的MPL是一个通用逼近器
- 深层模型比浅层模型需要更少的参数
- 深层模型往往比前曾模型更难训练
- 定义
欢迎大家加VX:bbplayer2021 (木青)进群交流,备注 申请加入生信交流群。