<机器学习笔记-02> <scikit-learn -02>线性回归

<机器学习笔记-02> (scikit-learn 02)线性回归


摘要:本文是“Mastering Machine Learning With scikit-learn”第二章“线性回归”的学习笔记,对书中源码进行实现,并对书中内容按照知识模块进行整理,尤其是对python函数整理力求做到清晰有条理;

注1:笔记中重在功能实现,对于基本理论理解不深,以后还是需要加强的。

注2:本文第一次使用Pypora软件写成md文件,然后上传到MarkDown页面,在序号排版方面比CSDN自带的要好些,但是快捷键不如CSDN博客方便,而数学公式和图片上传还都不太熟悉;


  1. 知识要点总结:
    1. 基本概念:
      1. 掌握模型:一元/多元线性回归模型,一元多项式回归模型;
      2. 理解概念:损失函数、残差;
      3. 理解回归拟合模型参数估计,尤其是最小二乘法;理解正则化的常用方法(岭回归法,LASSO法,弹性网);
      4. 理解预测结果的方法,尤其是R-Square;
      5. 理解梯度下降法;
    2. Python基本功能:
      1. 读入库/库中的某个函数,或为其取别名;
      2. 掌握terminal输入多行命令的方法;
      3. 使用def定义函数
      4. 使用print函数输出文本和数字;
      5. 掌握for循环使用
      6. 掌握用enumerate()获取列表的索引和数值
      7. 会用shape()和reshape()对Array的形状进行操作;
      8. 掌握list的索引号调用方法;
    3. Matplotlib库
      1. 打开Inline显示图片功能;
      2. 定义显示图片的文字(大小+字体)、题目、坐标轴(名称+范围)、打开网格;
      3. 绘制不同颜色的点、线;
      4. 绘制散点分布图;
    4. Numpy库
      1. 会求均值、方差、协方差;
      2. 会求矩阵的dot,inv,transpose();
      3. 使用lstsq()求最小二乘法;
    5. Sklearn库
      1. 会基于linear_model.LinearRegression建立一元/多元线性回归模型;会基于LinearRegression和preprocessing.PolynomialFeatures建立一元多次线性回归模型;会基于linear_model.SGDRegressor建立随机梯度下降SGD模型;
      2. 使用model.fit()建模,使用model.predict()预测,使用model.score()求测试集的R-Square;
      3. 基于cross_validation,会用train_test_split()函数划分训练集和测试集,会用cross_val_score()计算交叉检验的R-Squre结果;
  2. 基本概念与理论分析
    1. 损失函数(loss function):用来定义模型与观测值的误差;
    2. 残差(residuals):模型预测的数值与训练集数据的差异,也叫训练误差(training erros);
    3. LinearRegression类fit()学习方法下的
      1. 一元线性回归模型为: y=a+bx
      2. 多元线性回归模型为: y=a+b
  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值