线性回归算法梳理1

本文介绍了有监督学习与无监督学习的基本概念,重点讲述了线性回归的原理、损失函数、优化方法如梯度下降法,以及评估指标如皮尔逊相关系数和均方根误差。此外,还提到了过拟合和欠拟合的解决方案,并简单介绍了sklearn线性回归模型的参数设置。
摘要由CSDN通过智能技术生成
  • 机器学习的一些概念
    有监督学习、无监督学习
    根据数据是否拥有标记信息,学习任务可以分为有监督学习和无监督学习。

有监督学习:用已知某种或某些特性的样本作为训练集,以建立一个数学模型,再用已建立的模型来预测未知样本,此种方法称为有监督学习。
分类(离散)和回归(连续)属有监督学习;

无监督学习:根据类别样本(没有被标记)的训练样本解决模型识别中的各种问题。
聚类属无监督学习
泛化能力
学得模型应用于新样本的能力称为泛化能力
训练样本越多,得到关于“分布”D的信息越多,越有可能通过学习获得具有强泛化能力的模型。
过拟合欠拟合
过拟合:因为学习能力太好,把训练样本所包含的不太一般的特点当成所有潜在样本都会具有的一般性质,导致泛化性能下降的情况。
解决方法:①留出法——将数据集分成互斥的训练集和测试集
②交叉验证法——将数据集D分为k个大小相似的互斥子集,然后,每次用k-1个并集作为训练集,余下的那个子集作为测试集,这样,可以得到k组训练集和测试集,从而进行k次的训练和测试,最终返回K个测试结果的均值。
在这里插入图片描述
③ 自助法——在m个数据集中采样组成训练集,数据集\训练集用作测试集的方法。适用数据集较小,难以区分训练集/测试集的情况

欠拟合:因为学习能力太差,

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值