- 博客(7)
- 收藏
- 关注
原创 申请评分卡——特征工程
点击下载要使用的数据读取数据并导入相关包import pandas as pdimport datetimeimport collectionsimport numpy as npimport random#from sklearn.preprocessing import MDLPfrom numpy import nan as NAfrom pandas import ...
2018-08-27 21:12:45 1410 4
原创 使用XGBT构建——互联网金融客户流失模型
点击下载是所需数据from pandas import DataFramefrom numpy import nan as NAfrom pandas import Seriesimport os import pandas as pdimport numpy as npimport mathimport randomfrom matplotlib import pyplo...
2018-08-19 02:00:59 3260
原创 客户流失预警模型——数据预处理与特征衍生
1. 数据预处理1.1 极端的处理 1、人为截断,高于某一阈值的数据,统一等于某一个数2、删除极端值3、单独建模型1.2 缺失值的处理1.2.1 种类:1、完全随机缺失2、随机缺失,依赖其他变量,如‘配偶姓名’的缺失取决于‘婚姻状况’3、完全非随机缺失:缺失值是由于本身缺陷导致,如年龄较低的信用卡办卡人员不愿意透露父母亲的电话。1.2.2 处理方法...
2018-08-19 01:54:24 8357
原创 客户流失预警模型——查看单因子变量分析与多因子变量分析
常用风险因子静态信息:客户持有的产品数量、种类客户的年龄、性别客户所处地理 位置产品类别 动态信息:交易的间隔时间营销、促销手段银行的服务方式和态度 单因子分析之连续变量1、有效记录占比2、整体分布 初始分布 截断分布3、按目标变量分布的差异方差分析,用于...
2018-08-16 14:24:24 2644
原创 FDDC2018金融算法挑战赛01-A股上市公司季度营收预测
天池大赛链接我所用到的数据1、income_gb_2代表的是我从天池原有的income_statement中的general business导出的,balance_gb_2和cash_gb_2 首亦然。2、 Macro为宏观数据,Market为市场数据导入相关包,将工作目录改为数据所在目录from pandas import DataFramefrom numpy i...
2018-08-06 15:38:33 4005 4
原创 逻辑回归原理介绍与案例python代码实现
逻辑回归是用于分类的算法。平常的线性回归方程为f(x)=wx+b,此时f(x)的取值可以是任意的,要让预测的值可以分类,例如分类到class1是预测值为1,分类到class2时预测值为0。这时我们就要用到分类函数。下面来介绍一个分类函数sigmoid:其中z=wx+bf(z)的取值将在0与1之间,如下图有:设f(z)表示分类到class1是的概率,则分类到class2的概率为1-f(z)。假设我们...
2018-05-24 21:48:25 8006 1
原创 线性回归、梯度下降原理介绍与案例python代码实现
梯度下降的公式:w := w-α梯度下降的公式来源于泰勒的一阶展开式泰勒公式就是说一个函数如果可无数次微分则有:如果x与a非常接近时有案例数据下载地址#载入必须使用的python库import csvimport numpy as npimport pandas as pdimport osimport math#将数据保存到当前工作目录。#若不知道当前工作目录可执行os.get...
2018-05-22 15:36:53 1151
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人