目录
一 回归算法核心思想
1 符合线性模型
即特征集X与目标属性Y之间满足线性关系,符合线性模型
2 数据距离拟合超平面的直线距离最小
期望确定某个超平面,使得训练集数据均匀分布于超平面两侧,且距离超平面直线距离最小
二 回归算法模型
1 前提要求
1 )线性模型
(
,截距
以包含在内)
注意:,
,
均为随机变量,
为系数,且
满足独立同分布
2)残差分布
,根据中心极限定理决定
3 )极大似然原理
假设一场试验中,发生A结果,并未发生B结果或者其他结果,那么说明该试验对A有利,进而数学上可以表达为,其中
为有利于A的条件
2 模型构建
第一步:残差的联合概率密度函数
第二步:构建对数似然函数