数据挖掘算法_机器学习与数据挖掘十大经典算法之逻辑回归算法

本文介绍了逻辑回归算法,一种用于二元分类的机器学习算法。内容包括逻辑回归的简介、数学思想、算法步骤以及Python实现。通过逻辑回归,可以预测事件发生的概率,并在实际中应用于邮件分类、金融欺诈检测和肿瘤良性判断等问题。
摘要由CSDN通过智能技术生成

dcaec0e11ee2c188509e6b37458d07cc.gif

b29897042e401ef106f7a92d4031e271.gif

题记:前一篇《机器学习与数据挖掘十大经典算法之PageRank算法》发表之后,有不少读者给我留言说好希望快点更新,奈何最近工作实在太忙,逻辑回归算法的介绍只能在这期电子杂志里和大伙儿见面了。

一、逻辑回归的简介

  逻辑回归,英文名是logistic regression。它是一种广泛使用的机器学习算法。尽管名字中有“回归”二字,但它其实是一种二元分类算法,也就是通过已知的自变量来预测数据是属于哪个类别的(也就是,判断数据的标签是 真或假,是或否等)。

  在现实生活中,也有很多二元分类问题。例如,判断一封邮件是否为垃圾邮件?判断一次金融交易是否存在欺诈嫌疑?判断肿瘤是否是良性的?

二、逻辑回归的数学思想

  通过拟合一个逻辑函数/假设函数(logic function/hypothesis function)来预测一个事件发生的概率,既然预测的是概率值,那么输出结果必须在(0--1)之间。

  一般线性回归的结果(即y=h(Θ,x)的结果)是连续值,取值范围也是不确定的。我们需要找到一个数学公式,将连续值转换成(0--1)之间的值。

  这个转换函数就是sigmoid函数:1ce6e4aa46dbc1ae758bc4af780bb5e6.png,它的图像如下:

f439086f54a47bbc2af693ccf828ef1d.png

三、逻辑回归的算法步骤

  初始化权重:即给定向量Θ的初始值,方便后续不断迭代更新。

  加载数据:加载训练数据,方便拟合出假设函数

  计算假设函数

502e7aa2d205d3c7d7daf532a33af9c1.png

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值