监督学习-分类模型1-线性分类器(Linear Classifiers)

本文深入探讨线性分类器,重点介绍了逻辑斯蒂回归模型的原理和实现。通过手动实践《python机器学习-通往kaggle竞赛之路》,作者详细解释了模型的构建过程,包括性能测评、编程实践和特点分析。模型利用线性关系和逻辑斯蒂函数处理二分类问题,并应用随机梯度上升算法进行参数学习。此外,文章还涵盖了混淆矩阵、准确率、精确率、召回率和F1指标等评价标准。
摘要由CSDN通过智能技术生成

打算把《python机器学习-通往kaggle竞赛之路》手动敲一遍,

  • 加强机器学习各个算法和操作步骤的代码记忆
  • 熟悉使用markdown的公式语法,便捷工具mathpix
  • 熟悉机器学习专有名称和英文表达
  • 将python2代码转为python3代码
  • 修改过期的模块引用,如from sklearn.cross_validation改为 from sklearn.model_selection

造导弹,自主研发需要4年,模仿只需1年 - 《钱学森》

模型介绍:线性分类器(linear classification),是一种假设特征与分类结果存在线性关系的模型。这个模型通过累加计算每个维度的特征与各自权重的乘机来帮助类别决策。

如果我们定义 $ x = <x_1,x_2,···,x_n> $来表示 n n n 维特征列向量,同时用 n n n 维列向量 w = &lt; w 1 , w 2 , ⋅ ⋅ ⋅ , w n &gt; w=&lt;w_1,w_2,···,w_n&gt; w=<w1,w2,,wn>来代表对应的权值,或者叫做系数(coefficient);同时为了避免其过坐标原点的这种硬性假设,增加一个截距(intercept)b。由此这种线性关系便可以表达为:
f ( w , x , b ) = w T x + b ( 1 ) f(w,x,b)=w^Tx+b (1) f(w,x,b)=wTx+b1
这里的 f ∈ R f \in R fR ,取值范围分布在整个实数域中。然而,我们要处理的最简单的二分类问题希望$ f \in { 0,1}$,因此需要一个函数把原先的 f ∈ R f \in R fR 映射到(0,1)。于是用到了逻辑斯蒂(logistic)函数:
g ( z ) = 1 1 + e − z ( 2 ) g(z)=\frac{1}{1+e^{-z}} (2) g(z)=1+ez12
这里的 z ∈ R z \in R zR并且 g ∈ ( 0 , 1 ) g \in (0,1) g(0,1),并且其函数图像如图2-2所示。在这里插入图片描述
综上,如果将 z z z替换为 f

  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值