python朴素贝叶斯调参_机器学习从入门到放弃之朴素贝叶斯

简介

这次我们来谈谈机器学习中另外一个数学气息比较浓的算法朴素贝叶斯算法。

可能有朋友会看见数学气息比较浓心理就咯噔一下,先别急着叉掉本文,说朴素贝叶斯算法算法的数学气息比较浓,并非它有什么巨发杂的数学公式,而是它常见于概率统计之中,在本科教育就有对其比较详细的描述,而之前体积的K邻近,决策树,包括以后可能会谈到的SVM,神经网络网络等,恐怕不是专业领域,很难知道这些名词。

当然,可能你已经忘记了,那我们就先看看公式吧

$$P(B|A)=frac {P(A|B)P(B)} {P(A)}$$

怎么样,是否有一种熟悉感?

上面就是贝叶斯公式,接下来,开始说一下算法该如何设计。

算法设计

第一步我们需要对上述公式进行推广至N维特征

$$P(Y|X_1X_2.....X_N)=frac {P(X_1X_2.....X_N|Y)P(Y)}{P(X_1X_2.....X_N)}$$

上述公式可解析为,当对象满足[X1,X2……Xn]这些特征时,该对象属于Y类的概率是多少。

显然,只要我们算出每一个Y的值,概率最大的那个类别,就是我们想要的。

由于作为分母的P(X_1X_2.....X_N)在每个类别的计算都是相同的,而我们只需比较大小,并不需要每一个的准确值,公式自然可以简化成

$$f(x)=P(X_1X_2.....X_N|Y)P(Y)$$

为了进一步简化计算,我们假设每个特征都彼此独立(这也是该算法被称为朴素贝叶斯的原因),因此,公式将变成

$$f(x)=P(X_1|Y)P(X_2|Y).....P(X_n|Y)P(Y)$$

这一下就相当清晰明了。

P(X1|Y)P(X2|Y).....P(Xn|Y)与输入变量有关(分别表示在训练集中Y某值时,然后X1为某值时的概率),但P(Y)是恒定的,因此该算法就是在训练过程中,根据训练集,计算出每一个Y的概率值,再在运行期与特征进行运算。

最后只需进行简单的排序,即可获得预测结果。

代码实现

代码也是在我之前的github仓库中

如果你对机器学习的算法有足够的认识,你会发现朴素贝叶斯和前些时候提到的K邻近算法,算是比较容易自己实现的,因为其他算法即使忽略数学证明和推导,你也不可避免的理解每一个参数和函数的意义,这样你才能理解调参后悔对模型有什么影响,但是朴素贝叶斯和K邻近算法,只是单纯的代数运算而已。

既然如此,对机器学习感兴趣的同学,为什么不自己实现一次呢?have fun~~~

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
大学生参加学科竞赛有着诸多好处,不仅有助于个人综合素质的提升,还能为未来职业发展奠定良好基础。以下是一些分析: 首先,学科竞赛是提高专业知识和技能水平的有效途径。通过参与竞赛,学生不仅能够深入学习相关专业知识,还能够接触到最新的科研成果和技术发展趋势。这有助于拓展学生的学科视野,使其对专业领域有更深刻的理解。在竞赛过程中,学生通常需要解决实际问题,这锻炼了他们独立思考和解决问题的能力。 其次,学科竞赛培养了学生的团队合作精神。许多竞赛项目需要团队协作来完成,这促使学生学会有效地与他人合作、协调分工。在团队合作中,学生们能够学到如何有效沟通、共同制定目标和分工合作,这对于日后进入职场具有重要意义。 此外,学科竞赛是提高学生综合能力的一种途径。竞赛项目通常会涉及到理论知识、实际操作和创新思维等多个方面,要求参赛者具备全面的素质。在竞赛过程中,学生不仅需要展现自己的专业知识,还需要具备创新意识和解决问题的能力。这种全面的综合能力培养对于未来从事各类职业都具有积极作用。 此外,学科竞赛可以为学生提供展示自我、树立信心的机会。通过比赛的舞台,学生有机会展现自己在专业领域的优势,得到他人的认可和赞誉。这对于培养学生的自信心和自我价值感非常重要,有助于他们更加积极主动地投入学习和未来的职业生涯。 最后,学科竞赛对于个人职业发展具有积极的助推作用。在竞赛中脱颖而出的学生通常能够引起企业、研究机构等用人单位的关注。获得竞赛奖项不仅可以作为个人履历的亮点,还可以为进入理想的工作岗位提供有力的支持。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值