写上一篇文章的过程中,讲到逻辑回归是如何利用Sigmoid函数将线性回归的数值转换为概率时,才意识到自己对逻辑回归的理解十分浅显,为什么是Sigmoid函数?它一个就说是概率了?数学原理是什么?为了增加理解,尝试整理了所查资料的知识点,文中会放上不同信息的参考来源。
1.广义线性模型 Generalized linear model
首先需要知道广义线性模型,即GLM,说实话没学过啥统计学这那的课,看到很多数学术语、专业刻板的描述、数学公式简直读到头大,尝试按自己目前理解的去描述,如果有错误还希望指正。
广义线性模型是线性回归模型的推广。数学家们发明了线性回归这一方法用来解决现实中的问题,比如预测房价啦等等,但是这个模型显然是受很多假设限制的,它只能用来预测数值,无法进行分类;它假设随机误差服从0均值的正态分布;回归模型对参数来说是纯线性的...具体可以参照这篇文章:经典线性回归模型十大假定。
可以看到,想使用传统线性回归模型(y=wx+b)的条件是较为严苛的,面对现实情况各种更复杂的问题,很多传统假设不再适用,但其中依然隐含线性关系可以让我们解决,那么就推广出了更具代表性的,更广义的线性模型。
----------------------------------------------------------
经过抽象,广义线性模型由三个部分组成,具体参考了这篇文章:广义线性模型(GLM)概述
1.随机部分:我们拥有N个数量的真实值y,如掌握了N个房子的房价,这N个y是彼此相互独立的,同时每个y都是受同一组参数控制的,比如计算房价的过程中我们只要用到一组w来左右不同信息对结果的影响,也就是不同的信息乘上这组w 产