machine learning
文章平均质量分 94
BernadetteDi
这个作者很懒,什么都没留下…
展开
-
拍拍贷风控违约预测
拍拍贷风控违约预测项目背景介绍国内网络借贷行业的贷款风险数据1.包括信用违约标签(因变量)2.建模所需的基础与加⼯字段(自变量)3.相关用户的网络行为原始数据本着保护借款⼈隐私以及拍拍贷知识产权的目的,数据字段已经过脱敏处理。数据信息Master(每一行代表一个成功成交借款样本,每个样本包含200多个各类字段。1.idx:每笔贷款的unique key,可与另外2个文件里的idx相匹配。2.UserInfo_*:借款人特征字段3.WeblogInfo_*:Info网络行为字段原创 2021-03-16 06:00:52 · 1166 阅读 · 1 评论 -
住房月租金预测
住房月租金预测项目介绍项目目的当今社会,房屋租金由装修情况、位置地段、户型格局、交通便利程度、市场供需量等多方面因素综合决定,对于租房这个相对传统的行业来说,信息严重不对称一直存在。一方面,房东不了解租房的市场真实价格,只能忍痛空置高租金的房屋;另一方面,租客也找不到满足自己需求高性价比房屋,这造成了租房资源的极大浪费。本项目基于租房市场的痛点,提供脱敏处理后的真实租房市场数据。选手需要利用有月租金标签的历史数据建立模型,实现基于房屋基本信息的住房月租金预测,为该城市租房市场提供客观衡量标准。原创 2021-03-16 05:21:47 · 1129 阅读 · 2 评论 -
迁移学习在风控建模冷启动中的应用(简介)
迁移学习在风控建模冷启动中的应用(简介)目录迁移学习在风控建模冷启动中的应用(简介)背景与文献回顾基础理论介绍迁移学习概念迁移学习方法实证分析实验结论与局限性现状与展望背景与文献回顾背景风控在国家层面的重要性三大攻坚战的“作战图”,其中之一就是推动重大风险防范化解取得明显进展。 2020年是进行防范化解金融风险目标的收官之年。风控在金融机构层面的重要性信贷风险控制是贷款机构的生存之本,也是提高收益的关键。互联网金融风控体系互联网...原创 2021-03-16 05:21:15 · 1371 阅读 · 1 评论 -
互联网金融信用评分卡模型构建
互联网金融信用评分卡模型构建背景介绍信用风险计量体系包括主体评级模型和债项评级两部分。主体评级和债项评级均有一系列评级模型组成,其中主体评级模型可用“四张卡”来表示,分别是A卡、B卡、C卡和F卡;债项评级模型通常按照主体的融资用途,分为企业融资模型、现金流融资模型和项目融资模型等。 我们主要讨论主体评级模型的开发过程。项目流程典型的信用评分模型如图1-1所示。信用风险评级模型的主要开发流程如下:(1) 数据获取,包括获取存量客户及潜在客户的数据。存量客户是指已经在证券公司开展相关融资类业务的客原创 2021-03-15 23:51:18 · 782 阅读 · 0 评论 -
kaggle住房预测项目——第4部分(其他数据预处理方法)
kaggle住房预测项目——第4部分(其他数据预处理方法)import numpy as npimport pandas as pd%matplotlib inlineimport matplotlib.pyplot as pltimport seaborn as snscolor = sns.color_palette()sns.set_style('darkgrid')from scipy import statsfrom scipy.stats import norm, skew原创 2021-03-15 23:00:08 · 1305 阅读 · 1 评论 -
kaggle住房预测项目——第3部分(stacking)
kaggle住房预测项目——第3部分(stacking)import numpy as npimport pandas as pdimport randomimport datetimeimport copyfrom sklearn.metrics import make_scorerfrom sklearn.metrics import mean_squared_log_errorfrom sklearn.model_selection import GridSearchCVimport原创 2021-03-15 22:42:38 · 924 阅读 · 1 评论 -
kaggle住房预测项目——第2部分(bagging)
kaggle住房预测项目——第2部分基线模型import xgboost as xgbimport copyimport datetime,timefrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import mean_squared_log_error4from sklearn.metrics import make_scorerdef xgb_eval(data): def my原创 2021-03-15 18:42:16 · 1499 阅读 · 0 评论 -
kaggle住房预测项目——第1部分
kaggle住房预测项目——第1部分项目介绍项目地址项目目的数据介绍目标:预测每个房屋的销售价格是您的工作。对于测试集中的每个ID,您必须预测SalePrice变量的值。评估指标根据预测值的对数与观察到的销售价格的对数之间的均方根误差(RMSE)评估提交的内容。(记录日志意味着预测昂贵房屋和廉价房屋的错误将同等地影响结果。)加载数据集导入工具包,数据读取import pandas as pdimport numpy as npimport matplotlib.pyplot as p原创 2021-03-15 17:54:54 · 1247 阅读 · 0 评论 -
机器学习小知识点系列:sklearn.model_selection.KFold
机器学习小知识点系列:sklearn.model_selection.KFoldKFoldParametersn_splits : int, default=5shuffle : bool, default=Falserandom_state : int or RandomState instance, default=NoneMethodsget_n_splits(X=None, y=None, groups=None)split(X, y=None, groups=None)ExamplesKFold原创 2020-10-13 23:46:31 · 463 阅读 · 0 评论 -
笔记Andrew Ng:Machine Learning Week2
笔记Andrew Ng:Machine Learning Week2一、Linear Regression with Multiple Variables(1) Multivariate Linear RegressionMultiple FeaturesGradient Descent for Multiple Variablepython:compute Cost FunctionGradi...原创 2020-04-23 02:21:13 · 429 阅读 · 0 评论 -
笔记Andrew Ng:Machine Learning Week1
IntroductionWhat is Machine LearningdefinitionArthur Samuel:(an older, informal definition)the field of study that gives computers the ability to learn without being explicitly programmed.Tom M...原创 2020-04-23 02:05:29 · 279 阅读 · 0 评论