【机器学习算法总结】线性回归

1 机器学习概念

  • 损失函数/代价函数:当我们选定决策函数 f ( X ) f(X) f(X)时,对于给定的输入 X X X,由 f ( X ) f(X) f(X)给出相应的输出 Y Y Y,为了能够表现出 f ( X ) f(X) f(X)拟合的好坏,我们定义一个函数来度量拟合的程度,这个函数就称为损失函数。比如 L ( Y , f ( X ) ) = ( Y − f ( X ) ) 2 L ( Y , f ( X ) ) = ( Y - f ( X ) ) ^ { 2 } L(Y,f(X))=(Yf(X))2
  • 过拟合:如果一味提高模型对训练数据的预测能力时,模型的复杂度会提高,此时对于测试数据的预测能力就会降低。
  • 正则化:解决过拟合的典型方法就是正则化,在损失函数上加一个正则化项,一般为模型参数向量的范数,他的作用是选择损失函数和正则化项同时较小的模型参数。
  • 目标函数:目标函数即最终优化的函数,与损失函数有关,在加上正则化项之后,最终的目标函数及为 min ⁡ ( Y − f ( X ) ) 2 + λ J ( f ) \min ( Y - f ( X ) ) ^ { 2 } + \lambda J ( f ) min(Yf(X))2+λJ(f)
  • 泛化能力:泛化能力是指模型对未知数据的预测能力,一般采用测试数据集的误差来评价模型的泛化能力。
  • 评价函数:模型的评价一般基于训练误差和测试误差,另外在分类问题中,也会用精确率,召回率和F1score等来评价模型的好坏。

2 线性回归

假设有数据集 D = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , ⋯   , ( x m , y m ) } D = \left\{ \left( x _ { 1 } , y _ { 1 } \right) , \left( x _ { 2 } , y _ { 2 } \right) , \cdots , \left( x _ { m} , y _ { m } \right) \right\} D={ (x1,y1),(x2,y2),,(xm,ym)}
x i x_i xi有且仅有一个特征时,便可以构建出线性回归模型: f ( x ) = θ 0 + θ 1 x i f ( x ) = \theta _ { 0 } + \theta _ { 1 } x_i f(x)=θ0+θ1xi,其中 θ \theta θ即为要学习的参数。
x i x_i xi有n个特征时,即 x i = ( x i 1 , x i 2 , x i 3 , ⋯   , x i n ) x_i = (x_i^1,x_i^2,x_i^3, \cdots,x_i^n) xi=(xi1,xi2,xi3,,xin),令 x i = ( 1 , x i 1 , x i 2 , x i 3 , ⋯   , x i n ) x_i = (1,x_i^1,x_i^2,x_i^3, \cdots,x_i^n) x

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值