资料来源于网络搜集和汇总,把算法知识的总结放在业务知识后面也是为了说明实际工作业务落地应用的重要性大于算法创新。面试题依然是适用于3年经验以内的初学者,希望大家在学习算法的同时不要一心只研究算法而脱离了业务,要真正做到数据驱动业务。先附上之前对算法的一些总结:
关于逻辑回归
一、逻辑回归的优缺点,在金融领域相比其他算法有什么优势,局限性在哪?
(1)优点:
-
实现简单,速度快,占用内存小,可在短时间内迭代多个版本的模型。
-
模型的可解释性非常好,可以直接看到各个特征对模型结果的影响,可解释性在金融领域非常重要,所以在目前业界大部分使用的仍是逻辑回归模型。
-
模型客群变化的敏感度不如其他高复杂度模型,因此稳健更好,鲁棒性更强。
-
特征工程做得好,模型的效果不会太差,并且特征工程可以并行开发,大大加快开发的速度。
-
模型的结果可以很方便的转化为策略规则,且线上部署简单。
(2)缺点和局限性:
-
容易欠拟合,相比集成模型,准确度不是很高。
-
对数据的要求比较高,逻辑回归对缺失值,异常值,共线性都比较敏感,且不能直接处理非线性的特征。所以在数据清洗和特征工程上会花去很大部分的时间。
-
在金融领域对场景的适应能力有局限性,例如数据不平衡问题,高维特征,大量多类特征,逻辑回归在这方面不如决策树适应能力强。
二、逻辑回归是线性模型吗?逻辑回归和线性回归的区别?
逻辑回归是一种广义线性模型,它引入了Sigmod函数,是非线性模型,但本质上还是一个线性回归模型,因为除去Sigmod函数映射关系,其他的算法原理,步骤都是线性回归的。
逻辑回归和线性回归首先都是广义的线性回归,在本质上没多大区别,区别在于逻辑回归多了个Sigmod函数,使样本映射到[0,1]之间的数值,从而来处理分类问题。另外逻辑回归是假设变量服从伯努利分布,线性回归假设变量服从高斯分布。逻辑回归输出的是离散型变量,用于分类,线性回归输出的是连续性的,用于预测。逻辑回归是用最大似然法去计算预测函数中的最优参数值&#