西瓜书-第3章 线性模型

3.1 基本形式

给定由d个属性描述的示例x=(x_{1};x_{2};...;x_{d}),其中x_{1}是x的第i个属性上的取值,线性模型试图学得一个通过属性的线性组合来进行预测的函数, 即

                                                                   f(x)=\omega _{1}x_{1}+\omega_{2}x_{2}+...+\omega_{d}x{d}+b

一般用向量形式写成

                                                                                     f(x)=\omega^Tx+b

其中\omega=(\omega_1;\omega_2;...;\omega_d).\omega和b学得之后,模型就可以确定。

3.2 线性回归

给定数据集D=\left \{ (x_{1}, y_{1}),(x_{2}, y_{2}),...,(x_{m},y_{m})\right \},其中x_{i}=(x_{i1};x_{i2};...;x_{id}), y_{i}\in \mathbb{R}。”线性回归“试图学得一个线性模型以尽可能准确地预测实值输出标记。我们先考虑最简单的情形:输入属性的数目只有一个。为便于讨论,此时我们忽略关于属性的下标,即D=\left \{ (x_{i}, y_{i}) \right \}_{i=1}^{m},其中x_{i}\in \mathbb{R}.对离散属性,若属性间存在”序“关系,可通过连续化将其转化为连续值,例如二值属性”身高“的取值”高“”矮“可转化为{1.0, 0.0},三值属性”高度“的取值”高“”中“”低“可转化为{1.0, 0.5, 0.0};若属性间不存在序关系,假定有k个属性值,则通过转化为k维向量。

为确定\omega和b,由于均方误差时回归任务中最常用的性能度量,因此我们可让均方误差最小化,即

                                      (\omega^{*}, b^{*})=\underset{(\omega, b)}{argmin}\sum_{i=1}^{m}(f(x_{i})-y_{i})^2=\underset{(\omega, b)}{argmin}\sum_{i=1}^{m}(y_{i}-\omega x_{i}-b)^2

均方误差有非常好的集合意义,它对应了常用的欧几里得距离或简称”欧式距离“。基于均方误差最小化来进行模型求解的方法称为”最小二乘法“。在线性回归中,最小二乘法就是试图找到一条直线,使所有样本到直线上的欧式距离之和最小。

求解\omega和b使E_{(\omega, b)}=\sum_{i=1}^{m}(y_{i}-\omega x_{i}-b)^2最小化的过程,称为线性回归模型的最小二乘”参数估计“。我们可将E_{(\omega,b)}分别对\omega和b求导,得到

                           \frac{\partial E_{(\omega, b)} }{\partial \omega}=2(\omega\sum_{i=1}^{m}x_{i}^{2}-\sum_{i=1}^{m}(y_{i}-b)x_{i}), \frac{\partial E_{(\omega, b)} }{\partial \omega}=2(mb-\sum_{i=1}^{m}(y_{i}-\omega x_{i}))

然后令上面两式为0可得到\omega和b最优解的闭式解,即:

                                               \omega=\frac{\sum_{i=1}^{m}y_{i}(x_{i}-\bar{x})}{\sum_{i=1}^{m}x_{i}^{2}-\frac{1}{m}(\sum_{i=1}^{m})^{2}}, b=\frac{1}{m}\sum_{i=1}^{m}(y_{i}-\omega x_{i})

其中\bar{x}=\frac{1}{m}\sum_{i=1}^{m}(y_{i}-\omega x_{i})为x的均值。

更一般的情形是如本节开头的数据集D,样本有d个属性描述。此时我们试图学得f(x_{i})=\omega^{T}x_{i}+b,使得f(x_{i})\simeq y_{i},这就称为“多元线性回归”。类似的,可利用最小二乘法对\omega和b进行估计。为便于讨论,我们把\omega和b吸收入向量形式\hat{\omega}=(\omega;b),相应的,把数据集D表示为一个m*(d+1)大小的矩阵X,其中每行对应一个示例,该行前d个元素对应于示例的d个属性值对应于示例的d个属性值,最后一个元素横置为1,即:

                                         X=\begin{pmatrix} x_{11} & x_{12} & ... & x_{1d} & 1\\ x_{21} & x_{22} & ... & x_{2d} & 1 \\ ... & ... & ... & ...& ...\\ x_{m1} & x_{m2} & ... & x_{md} & 1 \end{pmatrix}=\begin{pmatrix} x_{1}^{T} & 1\\ x_{2}^{T} & 1\\ ... & ...\\ x_{m}^{T} & 1 \end{pmatrix}

再把标记也写成标量的形式y=(y_{1};y_{2};...;y_{m}),有\hat{\omega^{*}}=\underset{\hat{\omega}}{argmin}(y-X \hat{\omega})^{T}(y-X \hat{\omega})

E_{\hat\omega}=(y-X \hat\omega)^{T}(y-X\hat\omega),对\hat\omega求导得到\frac{\partial E_{\hat\omega}}{\partial \hat\omega}=2X^{T}(X\hat\omega-y),令其为0可得\hat\omega最优解的闭式解,此时我们做一个简单的讨论。当X^{T}X为满秩矩阵或正定矩阵时,令前面的式子为0可得\hat{\omega^{*}}=(X^{T}X)^{-1}X^{T}y。令\hat{x_{i}}=(x_{i}, 1),则最终学得的多元线性回归模型为f(\hat x_{i}^{T})=\hat x_{i}^{T}(X^{T}X)^{-1}X^{T}y

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
资源包主要包含以下内容: ASP项目源码:每个资源包中都包含完整的ASP项目源码,这些源码采用了经典的ASP技术开发,结构清晰、注释详细,帮助用户轻松理解整个项目的逻辑和实现方式。通过这些源码,用户可以学习到ASP的基本语法、服务器端脚本编写方法、数据库操作、用户权限管理等关键技术。 数据库设计文件:为了方便用户更好地理解系统的后台逻辑,每个项目中都附带了完整的数据库设计文件。这些文件通常包括数据库结构图、数据表设计文档,以及示例数据SQL脚本。用户可以通过这些文件快速搭建项目所需的数据库环境,并了解各个数据表之间的关系和作用。 详细的开发文档:每个资源包都附有详细的开发文档,文档内容包括项目背景介绍、功能模块说明、系统流程图、用户界面设计以及关键代码解析等。这些文档为用户提供了深入的学习材料,使得即便是从零开始的开发者也能逐步掌握项目开发的全过程。 项目演示与使用指南:为帮助用户更好地理解和使用这些ASP项目,每个资源包中都包含项目的演示文件和使用指南。演示文件通常以视频或图文形式展示项目的主要功能和操作流程,使用指南则详细说明了如何配置开发环境、部署项目以及常见问题的解决方法。 毕业设计参考:对于正在准备毕业设计的学生来说,这些资源包是绝佳的参考材料。每个项目不仅功能完善、结构清晰,还符合常见的毕业设计要求和标准。通过这些项目,学生可以学习到如何从零开始构建一个完整的Web系统,并积累丰富的项目经验。
资源包主要包含以下内容: ASP项目源码:每个资源包中都包含完整的ASP项目源码,这些源码采用了经典的ASP技术开发,结构清晰、注释详细,帮助用户轻松理解整个项目的逻辑和实现方式。通过这些源码,用户可以学习到ASP的基本语法、服务器端脚本编写方法、数据库操作、用户权限管理等关键技术。 数据库设计文件:为了方便用户更好地理解系统的后台逻辑,每个项目中都附带了完整的数据库设计文件。这些文件通常包括数据库结构图、数据表设计文档,以及示例数据SQL脚本。用户可以通过这些文件快速搭建项目所需的数据库环境,并了解各个数据表之间的关系和作用。 详细的开发文档:每个资源包都附有详细的开发文档,文档内容包括项目背景介绍、功能模块说明、系统流程图、用户界面设计以及关键代码解析等。这些文档为用户提供了深入的学习材料,使得即便是从零开始的开发者也能逐步掌握项目开发的全过程。 项目演示与使用指南:为帮助用户更好地理解和使用这些ASP项目,每个资源包中都包含项目的演示文件和使用指南。演示文件通常以视频或图文形式展示项目的主要功能和操作流程,使用指南则详细说明了如何配置开发环境、部署项目以及常见问题的解决方法。 毕业设计参考:对于正在准备毕业设计的学生来说,这些资源包是绝佳的参考材料。每个项目不仅功能完善、结构清晰,还符合常见的毕业设计要求和标准。通过这些项目,学生可以学习到如何从零开始构建一个完整的Web系统,并积累丰富的项目经验。
08-10
资源包主要包含以下内容: ASP项目源码:每个资源包中都包含完整的ASP项目源码,这些源码采用了经典的ASP技术开发,结构清晰、注释详细,帮助用户轻松理解整个项目的逻辑和实现方式。通过这些源码,用户可以学习到ASP的基本语法、服务器端脚本编写方法、数据库操作、用户权限管理等关键技术。 数据库设计文件:为了方便用户更好地理解系统的后台逻辑,每个项目中都附带了完整的数据库设计文件。这些文件通常包括数据库结构图、数据表设计文档,以及示例数据SQL脚本。用户可以通过这些文件快速搭建项目所需的数据库环境,并了解各个数据表之间的关系和作用。 详细的开发文档:每个资源包都附有详细的开发文档,文档内容包括项目背景介绍、功能模块说明、系统流程图、用户界面设计以及关键代码解析等。这些文档为用户提供了深入的学习材料,使得即便是从零开始的开发者也能逐步掌握项目开发的全过程。 项目演示与使用指南:为帮助用户更好地理解和使用这些ASP项目,每个资源包中都包含项目的演示文件和使用指南。演示文件通常以视频或图文形式展示项目的主要功能和操作流程,使用指南则详细说明了如何配置开发环境、部署项目以及常见问题的解决方法。 毕业设计参考:对于正在准备毕业设计的学生来说,这些资源包是绝佳的参考材料。每个项目不仅功能完善、结构清晰,还符合常见的毕业设计要求和标准。通过这些项目,学生可以学习到如何从零开始构建一个完整的Web系统,并积累丰富的项目经验。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值