《机器学习by周志华》学习笔记-线性模型-01基本形式与线性回归

本文是《机器学习》的学习笔记,主要探讨线性模型的基本形式和性质,尤其是线性回归的公式推理与参数确认。通过实例解释了线性模型如何用于预测,并详细阐述了一元和多元线性回归的最小二乘法求解过程,包括满秩和非满秩矩阵的情况。此外,还提到了归纳偏好和正则化在模型选择中的作用。
摘要由CSDN通过智能技术生成

1、基本形式

1.1、概念公式

给定由d个属性描述的示例x:

x=(x_{1},x_{2},...,x_{d})

其中每个属性的权重:

w=(w_{1},w_{2},...,w_{d})

其中xi是x在第i个属性上的值,线性模型试图学习一个通过属性线性作何来预测的函数,即:

f(x)=w_{1}x_{1}+w_{2}x_{2}+...+w_{d}x_{d}+b

用向量形式写成:

f(x)=w^{T}x+b

当w和b的参数学得之后,模型就可以确定。也叫「可理解性」

1.2、性质

1.2.1、优点

  • 形式简单
  • 易与建模
  • 蕴含机器学习中一些重要的基本思想
  • 功能强大的非线性模型可在线性模型的基础上引入层级结构或高维映射得到
  • 由于w直观表达了每个属性的权重,因此线性模型具有很好的可解释性。

1.2.2、案例说明

本书开头介绍了好瓜的评判标准,根据以上我们将:

好瓜模型设为:f_{g}(x),其中色泽用c表示,根蒂用r表示,敲声用s表示。则可得出好瓜模型:

f_{g}(x)=0.2x_{c}+0.5x_{r}+0.3x_{s}+1

其中权重w:

w=(w_{c},w_{r},w_{s})=(0.2,0.5,0.3)

b=1

根据上面案例,我们可以知道:

w_{r}> w_{s}> w_{c}

则意味着我们可以通过色泽c、根蒂r、以及敲声s来判断瓜是否是好瓜。

其中根蒂最要紧,其次是敲声,最后是颜色。根蒂比敲声重要,敲声比颜色重要。

2、线性回归

2.1、公式推理

给定m个样本的数据集D:

D=\left \{ (x_{1},y_{1}),(x_{2},y_{2}),...,(x_{m},y_{m}) \right \}

其中每个样本含有d个属性值。则:

x_{i}=(x_{i1},x_{i2},...,x_{id})

y_{i}\in \mathbb{R}

当属性值之间存在“序(order)”的关系,可通过连续化将其转化为连续值。

例如:

二值属性身高取值「高」「矮」,可转化为{1,0}

三值属性高度取值「高」「中」「低」,可转化为{3,2,1}

当属性值之间不存在“序(order)”的关系,可通过k个属性值用k维向量表示。

例如:

颜色属性有红、黄、蓝、绿4种,则转化为4维向量

红(1,0,0,0)

黄(0,1,0,0)

蓝(0,0,1,0)

绿(0,0,0,1) 

2.2、参数确认

2.2.1、属性值d

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI酱的读书笔记

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值