二元逻辑回归算法
项目做完了好一阵了,腾出点时间把算法简单整理一下,供大家参考。这里暂时只对预测结果是0、1两种情况的算法计算,如果预测结果是0、1、2.。。。或者A、B、C。。。等多个结果的话,再说,哈哈。
言归正传,我们前面准备好了数据,就是为了提供给算法进行计算,那么我们就努力去寻找自变量和因变量的关系吧。自变量可以多个,但是因变量只能是一个(也可能有多个的情况,这里不讨论,再开文章分析),所以很简单,就是一个多个因素影响一个结果的问题啦。
从数学角度考虑,凡事都能加减乘除计算,你可能觉得汉字不能加减乘除、图片不能加减乘除。。。但是我们在数据清洗的时候将文本、图片、音频等等进行数字化,就解决了不能直接计算的问题啦,例如汉字我们可以转成ASCII码,图片音频压缩取MD5再转ASCII码等等。
这样我们把自变量都做成可以计算的类型了,那就尝试找一找有没有一组权重数据,能让这些自变量计算后的值与因变量的值很贴合,这就是我们逻辑回归的最基本目标。