线性回归
回顾:
解析解(矩阵),数值解
随机,p ,小p-梯度下降(mini-batch)
L1正则化对应岭回归,L2对应lasso回归
分类评价:
混淆矩阵:正例,反例,预测结果,真实情况
--查准率,查全率
--PR图(调和平均),BEP(1.看曲线能否包出,2.平衡点,在外性能更好)
多混淆矩阵(宏)
聚类评价:
外部指标,内部指标
比较检验看泛化的效果,这才是真正需要的:留出法/交叉检验法->t分布检验
所谓特征工程,就是个名词,你为了做你的模型,把数据按照你的理解做出符合模型的特征。那么,杂乱的数据首先得有自己的理解,结合专业知识,进行数据清洗。
线性回归
SPSS 26下载与安装_张同学-CSDN博客_spss26
回归分析:
线性回归,一元线性回归,先判断是函数关系还是相关关系,即求相关系数。
一般表达式用最小二乘目标函数(也就是拟合)。为什么用平方和作为残差?首先,直接作差有正有负,而绝对值的数学性质不好(不利于求导),所以用平方,甚至还可以在前面乘一个1/2。
中心极限定理,样本均值=总体均值,不管总体是什么分布,任意一个总体的样本平均值都会围绕在总体的整体平均值周围,并且呈正态分布。极大似然估计,取对数。
解析解的问题:没有,n的值小于p,正定的,可逆的,转置,不能求解????
岭回归就是矩阵有一个岭,
它的名字来源于模型的解与正则化参数λ之间的图像。
logistical回归