机器学习笔记--回归分析(2)

一、多元线性回归模型

1.  概念

当Y值的影响因素不唯一时,采用多元线性回归模型

 


例如商品的销售额可能不电视广告投入,收音机广告投入,报纸广告投入有关系,可以有


是关于βi的函数。分别对βi求偏导并令偏导等于0,可以解出相应的βi的值

2.  例子

使用R中的Swiss数据集,包含了1888年瑞士国民经济发展数据集


我们要构造的模型是社会的繁荣程度和其它变量的关系:


Fertility就作为因变量,其它变量(.代表)作为自变量,可以看到结果

R值为0.7067说明这个模型变量是比较相关的,并且p值非常小说明这个模型不成立的概率很小,其次Residuals显示了平面上不同部分的残差,即四分位数和最小值、最大值。但是对于变量Examination的显著度水平很低,说明这个变量的关联性不大,我们可以将其剔除。(国家的发达程度和考试也许没多大关系…)

二、虚拟变量

例如

对于体重和身高、性别、人种都有关系,但是性别和人种是离散变量所以我们用虚拟变量表示,取0或1

如:isman iswoman isyellow isblack iswhite这几个变量

可以构建方程

W = a+bh+cisman+disyellow+eisblack(虚拟变量只取n-1个,因为不是男的就是女的)

所以,性别和人种只是影响截距,斜率是一样的,即虚拟变量是调整截距的作用。

如果想影响斜率,则用乘法模型:

W = a+bh+c*iswoman*h+d*isman*h(这里需要取n个)

若还想即影响斜率也影响截距,使用混合模型:

W = a+bh+cisman+disyellow+ e*iswoman*h+f*isman*h

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值