- 博客(10)
- 收藏
- 关注
原创 各类决策树算法的对比
各类决策树算法的对比ID3算法ID3算法基本原理算法的核心是在决策树各个节点上应用信息增益准则选择特征,递归的构建决策树。具体方法是:从根节点开始,对结点计算所有可能的特征的信息增益,选择信息增益最大的特征作为结点的特征,由该特征的不同取值建立子节点;再对子节点递归的调用以上方法,构建决策树;直到所有特征的信息增益均很小或者没有特征可以选择为止。信息增益的公式:C4.5算法C4.5算法原理算法用信息增益率选择特征,在树的构造过程中会进行剪枝操作优化,能够自动完成对连续属性的离散化处理;在选择
2022-04-15 18:12:51 1841
原创 线性回归和逻辑回归
线性回归和逻辑回归基本知识1. 线性回归的基本总结1.1 基本原理用线性函数你和数据,用MSE计算损失,然后用梯度下降法(GD)找到一组使MSE最小的权重,具体最小二乘法以及正规方程的推导如下图所示1.2 梯度下降求解不同的更新办法区别1.3 线性回归评价指标汇总2. 逻辑回归的基本总结2.1 逻辑回归的基本原理逻辑回归是最基本的分类方法,本质是二分类最大似然估计,采用的激活函数是Sigmoid函数,一般代价函数是交叉熵优点是:1)模型简单,不容易过拟合 2)可以直接看到每个
2022-04-13 21:52:00 664
原创 互联网金融:风控评分卡知识要点整理
风控评分卡知识要点##建立评分卡之前需要确定的要素1)项目目标2)项目范围3)时程规划4)成本效益分析5)配套措施6) 运营计划##评分卡模型开发七步骤1)确定评分目的2)基本参数的定义 1、分观察期和表现期。 2、违约和不确定的定义,使用滚动率来确定 3、确定评分范围 4、样本分组3)资料准备 1、来源:申请资料、内部黑名单、第三方数据 2、...
2019-03-04 16:06:12 5517 2
原创 Vintage分析和迁移率模型在网贷行业的运用
\setlength{\baselineskip}{20pt}#Vintage 分析和迁移率模型在网贷行业的运用网贷业务的核心竞争力来自收益与风险之间平衡点的把握,其收到消费理念、市场策略、市场消费环节影响,贯穿于产品设计、营销审批、授信、支用、还款、催收以及客户服务的全过程。风控偏好和市场竞争策略会导致不同机构的经营结果存在差异。面对纷繁复杂的竞争环境,网贷机构必须不断提高风险的监控能力才能...
2019-02-12 11:25:50 15921 4
原创 支持向量机算法简介以及利用以及python的实现
支持向量机算法简介(Python)一、支持向量机方法简介支持向量机(SVM)是一种常见的分类方法,在机器学习领域,是一个有监督的学习模型,通常用来进行模式识别、分类以及回归分析。SVM的核心思想主要为两点: 1. 它基于结构风险最小化理论之上在特征空间中构建最优超平面,使得学习器得到全局最优化,并且在整个样本空间的期望以某个概率满足一定上界。 2. 它是针对线性可分情况进行分析...
2018-02-13 14:09:34 5770 3
原创 WOE信用评分卡(python+Excel实现法)
信用评分卡是近年来兴起的一种为保障银行和其他金融部门的金融安全而设立的一种关于人生金融权限的划定模型。该模型指根据用户的信用历史资料,利用一定的信用评分模型,得到不同等级的信用分数。根据用户的信用分数,来决定是否放贷,以及相应的授信额度。随着目前小额消费贷的蓬勃发展,银行方面面临着单笔额度较小,申请额度分散,缺乏抵押以及客户质量不确定等诸多挑战,信用评分卡将会有广泛的应用前景。
2017-12-21 17:49:12 14496 7
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人