Logistic Regression算法

评论

目前,随着计算机技术的不断发展,给整个社会生活以及产业发展带来新的生机,产业技术的提升更新迫在眉睫。我们处于信息大爆发的时代,大数据中蕴含着丰富的资源,如何对数据进行科学的处理,提取其中有价值的信息,从而形成标准的可应用模型。逻辑回归算法是大数据中常用的数据分析方法之一,它具有模型简单、训练速度快等特点,在产业技术中有着广泛的应用。本文主要介绍逻辑回归算法的原理,以及对大数据环境下的逻辑回归算法进行详细的分析与研究,最后通过实践案例的分析来验证逻辑回归算法的可行性。本文的实践案例为对南斯拉夫卢布尔雅那大学医疗中心肿瘤研究所的威斯康辛乳腺癌数据集近700条数据模型的建立,可以通过数据分析来预测乳腺癌是良性还是恶性,以及建立逻辑回归模型。

逻辑回归模型不仅本身具有很高的预测精度,同时便于理解,符合监管对可解释性的要求。建立模型可选用的方法非常多,如区别分析、线性回归、逻辑回归及分类树等统计方法,或是人工神经网络、基因演算法及专家系统等非统计方法。本文采用逻辑回归的方法来建立数据驱动的评分模型。这是因为该模型的许多前提假设比较符乳腺癌基本特征规律,譬如它不要求模型变量间具有线性的相关关系,不要求变量服从协方差矩阵相等和残差服从正态分布等,这使得模型的适用性和灵活性都很好。具有实现简单,广泛的应用于工业问题上、分类时计算量非常小,速度很快,存储资源低、便利的观测样本概率分数、对逻辑回归而言,多重共线性并不是问题,它可以结合L2正则化来解决该问题等优点。

逻辑回归算法在实践应用中重要的步骤就是建立特征工程,特征工程的目的是最大限度地从原始数据中提取特征以供算法和模型使用。在实践应用中,大部分复杂模型的算法精进都是由数据科学家完成,我们能做的主要是数据获取、变量预处理、相关特征矢量提取、变量特征分析和预测。以本次乳腺癌预测模型为例,在模型的验证中,通常在建模数据量足够的情况下,建模样本分成估计样本和验证样本。前者被用于变量的选择和模型预测。后者将被用于验证模型的稳定性。一个好的风险模型应该对两类样本显示出一致的排序能力。将预留样本验证作为标准评分卡开发过程的一部分。估计样本通过用随机抽样随机选取80%的群体进行预测,与用其余的20%群体进行检验来验证是否同样有效。

五、结论与展望

5.1结论

乳腺癌是世界范围内妇女死亡的主要原因之一,准确的诊断是乳腺癌治疗中最重要的步骤之一。本文详细讲解了逻辑回归模型的原理知识,结合Sklearn机器学习库的Logistic Regression算法对乳腺癌威斯康辛(诊断)数据集进行了数据分类。由于该数据集分类标签划分为两类(恶性、良性),能够很好地适用于逻辑回归模型。用基于两个特征的逻辑回归模型得到的分类结果表明,与以往的方法相比,该方法在性能上有所提高。

结果不仅说明了该方法对乳腺癌诊断的能力,而且显示了在训练阶段的时间节省。通过更好地提取不同类型肿瘤的特征属性,能够有效提高该方法的分类准确率,医生也可以从抽象的肿瘤特征中获益。

在评估结果中不论训练还是测试准确率都在0.96-0.98之间,可以得到本次实验是具有非常高的可信度。也从本次实验中明白运用逻辑回归对人类疾病预测具有非常重要的意义,通过特征值来预测疾病的可能性可以帮助医学专家更好地发现与治疗癌症。

5.2展望

计算机系统的发展作为应用整体的作用不仅为人们的生活和工作带来了许多便利,甚至能够应用到国防、科研等领域中,解决各种实际上的问题。在信息化背景下,人们的生活方式和娱乐方式呈现出了多元化的趋势,再加上应用到各种企业办公中带来的便利性,使得它的创新和发展也成为全世界人类所关注的问题。

信息与计算机科学在高度上的发展是以它的作用为基础的,在这种技术的发展道路当中,使用速度和它自身的性能一直都在人们的关注上不断提升着,而且也体现出了很大的效果。在计算机科学技术的发展道路上,它所覆盖的范围也是越来越广,在生活、科学、教育、国防以及智能化等领域当中都有所利用。而且现阶段人们也是向着人工智能的阶段发展着,以纸质版的书籍和一些设备的使用都在实现电子化。在未来人们的工作甚至也能通过计算机完成,这就是信息与计算机科学发展的深度。深度上的发展指的主要就是人工智能,它是在人类大脑基础上研究出来的一种高技术,能够与人类之间产生互动,在这种技术下,人们可以与计算机之间产生相应的交流,而且能够通过人工智能实现办公与日常生活。而人工智能也是拥有着很强的感知能力和逻辑能力,这为人们带来了更大的科技便利性。计算机技术的发展和利用无论是对于人们的生活还是各个领域来说都十分的重要。而且在实践应用当中,它能够把自身的价值全部都体现出来,包括在人们生活当中提供的便利、企业经营管理中提供的优势、教育当中带来的高效、国防上带来的安全以及科研上提供的动力等等。而且对于智能化技术的研发一直都是人类的追求,在这样一个背景下,信息与计算机科学为人类文明的发展做出了很大的贡献。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值