自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 金融风控(五)模型融合

简单加权平均融合from xgboost import XGBClassifierfrom sklearn.linear_model import LogisticRegressionfrom sklearn.ensemble import RandomForestClassifier, VotingClassifierclf1 = LogisticRegression(random_state=1)clf2 = RandomForestClassifier(random_state=1)clf

2020-09-27 14:19:26 258

原创 金融风控(四)建模与调参

简单建模from sklearn.model_selection import KFoldpredictors = [ 'loanAmnt', 'term', 'interestRate', 'installment', 'grade', 'subGrade', 'employmentTitle', 'employmentLength', 'homeOwnership', 'annualIncome', 'verificationStatus', 'purpo

2020-09-24 18:33:07 155

原创 金融风控(三)——特征工程

金融风控(三)特征工程代码如下#按照平均数填充数值型特征data_train[numerical_fea] = data_train[numerical_fea].fillna(data_train[numerical_fea].median())data_test_a[numerical_fea] = data_test_a[numerical_fea].fillna(data_train[numerical_fea].median())#按照众数填充类别型特征data_train[categ

2020-09-21 19:30:44 209

原创 金融风控探索性数据分析

金融风控探索性数据分析(EDA)对数据简单查看f = open(r"E:\data\金融风控\train.csv")data_train = pd.read_csv(f)f_test = open(r"E:\data\金融风控\testA.csv")data_test = pd.read_csv(f_test)data_train.head()#查看数据前五行data_train.shape#查看数据的行列数data_train.columns#查看数据列的索引data_train.inf

2020-09-18 21:26:32 202

原创 2020-09-15

零基础入门金融风控-贷款违约预测(赛题理解)数据特征Field Descriptionid 为贷款清单分配的唯一信用证标识loanAmnt 贷款金额term 贷款期限(year)interestRate 贷款利率installment 分期付款金额grade 贷款等级subGrade 贷款等级之子级employmentTitle 就业职称employmentLength 就业年限(年)homeOwnership 借款人在登记时提供的房屋所有权状况annualIncome 年收入v

2020-09-15 16:27:09 126

原创 2020-08-23

决策树的介绍和应用决策树的介绍决策树是一种常见的分类模型,在金融分控、医疗辅助诊断等诸多行业具有较为广泛的应用。决策树的核心思想是基于树结构对数据进行划分,这种思想是人类处理问题时的本能方法。例如在婚恋市场中,女方通常会先看男方是否有房产,如果有房产再看是否有车产,如果有车产再看是否有稳定工作……最后得出是否要深入了解的判断。决策树的主要优点:具有很好的解释性,模型可以生成可以理解的规则。可以发现特征的重要程度。模型的计算复杂度较低。决策树的主要缺点:模型容易过拟合,需要采用减枝技术处理。

2020-08-23 15:07:41 117

原创 机器学习算法(一):基于逻辑回归的分类预测

逻辑回归简介逻辑回归(Logistics regression,简称LR),属于分类模型之一,广泛应用于各个领域之中。最突出的优点就是模型简单和模型的可解释能力强,同时计算代价不高,速度很快,存储资源低。缺点就是容易欠拟合,分类精度可能不高。逻辑回归的应用逻辑回归模型广泛用于各个领域,包括机器学习,大多数医学领域和社会科学。例如,最初由Boyd 等人开发的创伤和损伤严重度评分(TRISS)被广泛用于预测受伤患者的死亡率,使用逻辑回归 基于观察到的患者特征(年龄,性别,体重指数,各种血液检查的结果等)分

2020-08-20 22:38:07 182

原创 异常处理

Python 标准异常总结BaseException:所有异常的 基类Exception:常规异常的 基类StandardError:所有的内建标准异常的基类ArithmeticError:所有数值计算异常的基类FloatingPointError:浮点计算异常OverflowError:数值运算超出最大限制ZeroDivisionError:除数为零AssertionError:断言语句(assert)失败AttributeError:尝试访问未知的对象属性EOFError:没有内建输

2020-07-24 19:22:13 70

原创 条件语句

if-else 语句if expression: expr_true_suiteelse: expr_false_suite当expression的结果为真时执行expr_true_suite代码块,否则执行expr_false_suite代码块。【例子】champion = input("詹姆斯拿过几个总冠军")guess = int(temp)if guess ==3: print("你绝对詹姆斯铁粉")else: print("詹黑来了?")print("湖人总

2020-07-22 19:21:12 407

原创 变量、运算符与数据类型

变量、运算符与数据类型注释a单行注释使用(#(所要描述的文字))多行注释(’’’所要描述的文字‘’’)#所要描述的文字print("Hello Python")''''就是爱学习?'''运算符算数运算符比较运算符逻辑运算符位运算符其他运算符标注1.运算符的优先级:算数>比较>位运算>逻辑运算2.is,is not和==,!=的区别为:(1)is, is not 对比的是两个变量的内存地址。(2)==, != 对比的是两个变量的值。(3)比

2020-07-21 20:08:22 86

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除