<机器学习笔记-02> <scikit-learn -02>线性回归

最新推荐文章于 2022-08-01 09:19:02 发布

VIP文章赵鹏举

最新推荐文章于 2022-08-01 09:19:02 发布

阅读量2.2k

点赞数 2

分类专栏：机器学习 machine learning 文章标签： python 机器学习线性回归 Regression scikit

本文链接：https://blog.csdn.net/qq_25040013/article/details/52454365

版权

<机器学习笔记-02> (scikit-learn 02)线性回归

摘要：本文是“Mastering Machine Learning With scikit-learn”第二章“线性回归”的学习笔记，对书中源码进行实现，并对书中内容按照知识模块进行整理，尤其是对python函数整理力求做到清晰有条理；

注1：笔记中重在功能实现，对于基本理论理解不深，以后还是需要加强的。

注2：本文第一次使用Pypora软件写成md文件，然后上传到MarkDown页面，在序号排版方面比CSDN自带的要好些，但是快捷键不如CSDN博客方便，而数学公式和图片上传还都不太熟悉；

知识要点总结：
1. 基本概念：
  1. 掌握模型：一元/多元线性回归模型，一元多项式回归模型；
  2. 理解概念：损失函数、残差；
  3. 理解回归拟合模型参数估计，尤其是最小二乘法；理解正则化的常用方法（岭回归法，LASSO法，弹性网）；
  4. 理解预测结果的方法，尤其是R-Square；
  5. 理解梯度下降法；
2. Python基本功能：
  1. 读入库/库中的某个函数，或为其取别名；
  2. 掌握terminal输入多行命令的方法；
  3. 使用def定义函数
  4. 使用print函数输出文本和数字；
  5. 掌握for循环使用
  6. 掌握用enumerate()获取列表的索引和数值
  7. 会用shape()和reshape()对Array的形状进行操作；
  8. 掌握list的索引号调用方法；
3. Matplotlib库
  1. 打开Inline显示图片功能；
  2. 定义显示图片的文字（大小+字体）、题目、坐标轴（名称+范围）、打开网格；
  3. 绘制不同颜色的点、线；
  4. 绘制散点分布图；
4. Numpy库
  1. 会求均值、方差、协方差；
  2. 会求矩阵的dot,inv,transpose()；
  3. 使用lstsq()求最小二乘法；
5. Sklearn库
  1. 会基于linear_model.LinearRegression建立一元/多元线性回归模型；会基于LinearRegression和preprocessing.PolynomialFeatures建立一元多次线性回归模型；会基于linear_model.SGDRegressor建立随机梯度下降SGD模型；
  2. 使用model.fit()建模，使用model.predict()预测，使用model.score()求测试集的R-Square；
  3. 基于cross_validation，会用train_test_split()函数划分训练集和测试集，会用cross_val_score()计算交叉检验的R-Squre结果；
基本概念与理论分析
1. 损失函数(loss function)：用来定义模型与观测值的误差；
2. 残差（residuals）：模型预测的数值与训练集数据的差异，也叫训练误差（training erros）；
3. LinearRegression类fit()学习方法下的
  1. 一元线性回归模型为： $y=a+bx$ ；
  2. 多元线性回归模型为： y=a+b

最低0.47元/天解锁文章

赵鹏举

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
<机器学习笔记-02> <scikit-learn -02>线性回归

摘要：本文是“Mastering Machine Learning With scikit-learn”第二章“线性回归”的学习笔记，对书中源码进行实现，并对书中内容按照知识模块进行整理，尤其是对python函数整理力求做到清晰有条理；
复制链接

扫一扫