- 博客(10)
- 收藏
- 关注
原创 金融风控(五)模型融合
简单加权平均融合from xgboost import XGBClassifierfrom sklearn.linear_model import LogisticRegressionfrom sklearn.ensemble import RandomForestClassifier, VotingClassifierclf1 = LogisticRegression(random_state=1)clf2 = RandomForestClassifier(random_state=1)clf
2020-09-27 14:19:26 258
原创 金融风控(四)建模与调参
简单建模from sklearn.model_selection import KFoldpredictors = [ 'loanAmnt', 'term', 'interestRate', 'installment', 'grade', 'subGrade', 'employmentTitle', 'employmentLength', 'homeOwnership', 'annualIncome', 'verificationStatus', 'purpo
2020-09-24 18:33:07 155
原创 金融风控(三)——特征工程
金融风控(三)特征工程代码如下#按照平均数填充数值型特征data_train[numerical_fea] = data_train[numerical_fea].fillna(data_train[numerical_fea].median())data_test_a[numerical_fea] = data_test_a[numerical_fea].fillna(data_train[numerical_fea].median())#按照众数填充类别型特征data_train[categ
2020-09-21 19:30:44 209
原创 金融风控探索性数据分析
金融风控探索性数据分析(EDA)对数据简单查看f = open(r"E:\data\金融风控\train.csv")data_train = pd.read_csv(f)f_test = open(r"E:\data\金融风控\testA.csv")data_test = pd.read_csv(f_test)data_train.head()#查看数据前五行data_train.shape#查看数据的行列数data_train.columns#查看数据列的索引data_train.inf
2020-09-18 21:26:32 202
原创 2020-09-15
零基础入门金融风控-贷款违约预测(赛题理解)数据特征Field Descriptionid 为贷款清单分配的唯一信用证标识loanAmnt 贷款金额term 贷款期限(year)interestRate 贷款利率installment 分期付款金额grade 贷款等级subGrade 贷款等级之子级employmentTitle 就业职称employmentLength 就业年限(年)homeOwnership 借款人在登记时提供的房屋所有权状况annualIncome 年收入v
2020-09-15 16:27:09 126
原创 2020-08-23
决策树的介绍和应用决策树的介绍决策树是一种常见的分类模型,在金融分控、医疗辅助诊断等诸多行业具有较为广泛的应用。决策树的核心思想是基于树结构对数据进行划分,这种思想是人类处理问题时的本能方法。例如在婚恋市场中,女方通常会先看男方是否有房产,如果有房产再看是否有车产,如果有车产再看是否有稳定工作……最后得出是否要深入了解的判断。决策树的主要优点:具有很好的解释性,模型可以生成可以理解的规则。可以发现特征的重要程度。模型的计算复杂度较低。决策树的主要缺点:模型容易过拟合,需要采用减枝技术处理。
2020-08-23 15:07:41 117
原创 机器学习算法(一):基于逻辑回归的分类预测
逻辑回归简介逻辑回归(Logistics regression,简称LR),属于分类模型之一,广泛应用于各个领域之中。最突出的优点就是模型简单和模型的可解释能力强,同时计算代价不高,速度很快,存储资源低。缺点就是容易欠拟合,分类精度可能不高。逻辑回归的应用逻辑回归模型广泛用于各个领域,包括机器学习,大多数医学领域和社会科学。例如,最初由Boyd 等人开发的创伤和损伤严重度评分(TRISS)被广泛用于预测受伤患者的死亡率,使用逻辑回归 基于观察到的患者特征(年龄,性别,体重指数,各种血液检查的结果等)分
2020-08-20 22:38:07 182
原创 异常处理
Python 标准异常总结BaseException:所有异常的 基类Exception:常规异常的 基类StandardError:所有的内建标准异常的基类ArithmeticError:所有数值计算异常的基类FloatingPointError:浮点计算异常OverflowError:数值运算超出最大限制ZeroDivisionError:除数为零AssertionError:断言语句(assert)失败AttributeError:尝试访问未知的对象属性EOFError:没有内建输
2020-07-24 19:22:13 70
原创 条件语句
if-else 语句if expression: expr_true_suiteelse: expr_false_suite当expression的结果为真时执行expr_true_suite代码块,否则执行expr_false_suite代码块。【例子】champion = input("詹姆斯拿过几个总冠军")guess = int(temp)if guess ==3: print("你绝对詹姆斯铁粉")else: print("詹黑来了?")print("湖人总
2020-07-22 19:21:12 407
原创 变量、运算符与数据类型
变量、运算符与数据类型注释a单行注释使用(#(所要描述的文字))多行注释(’’’所要描述的文字‘’’)#所要描述的文字print("Hello Python")''''就是爱学习?'''运算符算数运算符比较运算符逻辑运算符位运算符其他运算符标注1.运算符的优先级:算数>比较>位运算>逻辑运算2.is,is not和==,!=的区别为:(1)is, is not 对比的是两个变量的内存地址。(2)==, != 对比的是两个变量的值。(3)比
2020-07-21 20:08:22 86
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人