- 博客(6)
- 收藏
- 关注
原创 LSTM时间序列 风控行为评分卡
前言:1.lstm并不能代替传统的逻辑回归评分卡,本文意在探讨lstm在nlp之外的作用,以及对用户行为数据的应用。2.知识与创意源自梅子行老师的 《智能风控-原理,算法与工程实践》。3.使用的数据无实际意义,用户信息神圣不可侵犯。数据与变量以客户为维度构建时间序列,时间刻度可以是月份也可以是期数,分别计算每月(每期)的额度使用率,逾期率,还款次数,罚息等聚合变量。构建特征矩阵,例如24期的7个变量组成24*7的矩阵带入LSTM模型。LSTM优缺点优点:1.RNN的隐藏层hth_tht是
2020-09-02 18:38:21 3042 1
原创 R语言对COVID19分析作业
#a.数据获取与基本统计分析#安装并引入COVID19包##install.packages(“COVID19”)library(COVID19)#提取截止至2020年5月31号数据library(dplyr)library(lubridate)rawdata <- data.frame(covid19())df <- filter(rawdata,month(date)<6)df <- filter(df,confirmed>10?0)#对国家分组求出确诊
2020-09-01 19:30:23 1925
原创 python 社交网络networkx 快速学习
import networkx as nx import pandas as pd import matplotlib.pyplot as plt edge_list=pd.read_csv('D:/CDA/risk_control/data/stack_network_links.csv') G=nx.from_pandas_edgelist(edge_list,source='source',target='target',edge_attr='value' )plt.figur
2020-08-30 20:38:13 1079
原创 python 基于卡方值分箱算法
原理很简单,初始分20箱或更多,先确保每箱中都含有0,1标签,对不包含0,1标签的箱向前合并,计算各箱卡方值,对卡方值最小的箱向后合并,代码如下import pandas as pdimport numpy as npimport scipyfrom scipy import statsdef chi_bin(DF,var,target,binnum=5,maxcut=20): ''' DF:data var:variable target:target / lab
2020-07-15 10:21:15 687
原创 R语言keras实现MLP二分类(风控金融诈骗识别)
背景:用kaggle 的 give me some credits数据集做一个MLP分类一般情况下,风控评分卡是不会用到深度学习的,毕竟xgboost是风控算法的天花板。本篇目的为方法的探索,与准确率(auc)的对比#调包library(keras)#导入数据集df <- read.csv("cs-training.csv",header = TRUE)#去除不必要变量及变量重命名df <- df[2:12]colnames(df) <- c("y","x1","x2
2020-07-10 10:00:50 1882 3
原创 用R语言scorecard包做一张标准评分卡
R语言的scorecard包可以满足标准评分卡的所有需求以下利用kaggle的give me some credits数据进行逻辑回归建模#导入包,读取数据require(scorecard)df <- read.csv("cs-training.csv",header = TRUE)# 变量选择#设置SeriousDlqin2yrs为目标,余下则为变量df_all <- var_filter(df, y="SeriousDlqin2yrs")#划分训练集与测试集按照7,3比
2020-07-09 21:48:37 2018
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人