- 机器学习的一些概念(有监督、无监督、泛化能力、过拟合欠拟合(方差和偏差以及各自解决办法)、交叉验证)
用已知某种或某些特性的样本作为训练集,以建立一个数学模型,再用已建立的模型来预
测未知样本,此种方法被称为有监督学习
与监督学习相比,无监督学习的训练集中没有人为的标注的结果
泛化能力,模型的预测能力 - 线性回归的原理
回归算法是一种比较常用的机器学习算法,用来建立“解释”变量(自变量X)和观
测值(因变量Y)之间的关系;从机器学习的角度来讲,用于构建一个算法模型(函
数)来做属性(X)与标签(Y)之间的映射关系,在算法的学习过程中,试图寻找一个
函数 使得参数之间的关系拟合性最好 - 线性回归损失函数、代价函数、目标函数的概念
(预测值-真实值)**2
1/2sum(1到m)(预测值-真实值)**2
h(x)=thetade转置x,即目标线性方程 - 一元线性回归的参数求解公式推导
最直接的,解线性方程
最大释然函数/最小二乘法都可以 - 多元线性回归的参数求解公式推导
梯度下降 - 线性回归的评估指标有哪些?原理是什么?
explained_varicance_score:可解释方差的回归评分函数
mean_absolute_error:平均绝对误差
mean_squared_error:平均平方误差 - sklearn参数详解(sklearn包里面线性回归的每个参数的作用)
lr = sklearn.linear_model.LinearRegression(fit_intercept=True, normalize=False, copy_X=True, n_jobs=1)
fit_intercept截距项
copy_X是否被改写
n_jobs内存运行的一种方式
算法梳理进阶线性回归 任务一
最新推荐文章于 2024-03-05 22:41:11 发布