python
文章平均质量分 94
BernadetteDi
这个作者很懒,什么都没留下…
展开
-
拍拍贷风控违约预测
拍拍贷风控违约预测项目背景介绍国内网络借贷行业的贷款风险数据1.包括信用违约标签(因变量)2.建模所需的基础与加⼯字段(自变量)3.相关用户的网络行为原始数据本着保护借款⼈隐私以及拍拍贷知识产权的目的,数据字段已经过脱敏处理。数据信息Master(每一行代表一个成功成交借款样本,每个样本包含200多个各类字段。1.idx:每笔贷款的unique key,可与另外2个文件里的idx相匹配。2.UserInfo_*:借款人特征字段3.WeblogInfo_*:Info网络行为字段原创 2021-03-16 06:00:52 · 1147 阅读 · 1 评论 -
住房月租金预测
住房月租金预测项目介绍项目目的当今社会,房屋租金由装修情况、位置地段、户型格局、交通便利程度、市场供需量等多方面因素综合决定,对于租房这个相对传统的行业来说,信息严重不对称一直存在。一方面,房东不了解租房的市场真实价格,只能忍痛空置高租金的房屋;另一方面,租客也找不到满足自己需求高性价比房屋,这造成了租房资源的极大浪费。本项目基于租房市场的痛点,提供脱敏处理后的真实租房市场数据。选手需要利用有月租金标签的历史数据建立模型,实现基于房屋基本信息的住房月租金预测,为该城市租房市场提供客观衡量标准。原创 2021-03-16 05:21:47 · 1111 阅读 · 2 评论 -
迁移学习在风控建模冷启动中的应用(简介)
迁移学习在风控建模冷启动中的应用(简介)目录迁移学习在风控建模冷启动中的应用(简介)背景与文献回顾基础理论介绍迁移学习概念迁移学习方法实证分析实验结论与局限性现状与展望背景与文献回顾背景风控在国家层面的重要性三大攻坚战的“作战图”,其中之一就是推动重大风险防范化解取得明显进展。 2020年是进行防范化解金融风险目标的收官之年。风控在金融机构层面的重要性信贷风险控制是贷款机构的生存之本,也是提高收益的关键。互联网金融风控体系互联网...原创 2021-03-16 05:21:15 · 1335 阅读 · 1 评论 -
互联网金融信用评分卡模型构建
互联网金融信用评分卡模型构建背景介绍信用风险计量体系包括主体评级模型和债项评级两部分。主体评级和债项评级均有一系列评级模型组成,其中主体评级模型可用“四张卡”来表示,分别是A卡、B卡、C卡和F卡;债项评级模型通常按照主体的融资用途,分为企业融资模型、现金流融资模型和项目融资模型等。 我们主要讨论主体评级模型的开发过程。项目流程典型的信用评分模型如图1-1所示。信用风险评级模型的主要开发流程如下:(1) 数据获取,包括获取存量客户及潜在客户的数据。存量客户是指已经在证券公司开展相关融资类业务的客原创 2021-03-15 23:51:18 · 771 阅读 · 0 评论 -
kaggle住房预测项目——第4部分(其他数据预处理方法)
kaggle住房预测项目——第4部分(其他数据预处理方法)import numpy as npimport pandas as pd%matplotlib inlineimport matplotlib.pyplot as pltimport seaborn as snscolor = sns.color_palette()sns.set_style('darkgrid')from scipy import statsfrom scipy.stats import norm, skew原创 2021-03-15 23:00:08 · 1295 阅读 · 1 评论 -
kaggle住房预测项目——第3部分(stacking)
kaggle住房预测项目——第3部分(stacking)import numpy as npimport pandas as pdimport randomimport datetimeimport copyfrom sklearn.metrics import make_scorerfrom sklearn.metrics import mean_squared_log_errorfrom sklearn.model_selection import GridSearchCVimport原创 2021-03-15 22:42:38 · 908 阅读 · 1 评论 -
kaggle住房预测项目——第2部分(bagging)
kaggle住房预测项目——第2部分基线模型import xgboost as xgbimport copyimport datetime,timefrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import mean_squared_log_error4from sklearn.metrics import make_scorerdef xgb_eval(data): def my原创 2021-03-15 18:42:16 · 1478 阅读 · 0 评论 -
kaggle住房预测项目——第1部分
kaggle住房预测项目——第1部分项目介绍项目地址项目目的数据介绍目标:预测每个房屋的销售价格是您的工作。对于测试集中的每个ID,您必须预测SalePrice变量的值。评估指标根据预测值的对数与观察到的销售价格的对数之间的均方根误差(RMSE)评估提交的内容。(记录日志意味着预测昂贵房屋和廉价房屋的错误将同等地影响结果。)加载数据集导入工具包,数据读取import pandas as pdimport numpy as npimport matplotlib.pyplot as p原创 2021-03-15 17:54:54 · 1213 阅读 · 0 评论 -
机器学习小知识点系列:sklearn.model_selection.KFold
机器学习小知识点系列:sklearn.model_selection.KFoldKFoldParametersn_splits : int, default=5shuffle : bool, default=Falserandom_state : int or RandomState instance, default=NoneMethodsget_n_splits(X=None, y=None, groups=None)split(X, y=None, groups=None)ExamplesKFold原创 2020-10-13 23:46:31 · 443 阅读 · 0 评论 -
django项目如何部署到阿里云服务器
django项目如何部署到阿里云服务器阿里云服务器购买在阿里云上搭建项目及安装数据库使用Git bash将本地项目文件推送到github远程仓库将github仓库导入阿里云安装依赖安装数据库如何将本地的数据库内容导入到阿里云呢?mysql问题Navicat测试连接阿里云Mysql修改settings.py文件uwsgi和nginx的部署搭建uwsgi启动项目如果端口被占用了,或者说如何重新部署项目现在我们先默认项目长这样:你的项目名/├── 你的项目名│ ├── __init__.py│原创 2020-06-09 23:16:38 · 778 阅读 · 0 评论 -
数据结构与算法: 排序之归并排序
数据结构与算法: 排序之归并排序归并排序原理/核心思想:递推公式伪代码merge函数具体过程:伪代码:python代码三个问题1.是否是稳定的排序算法2.时间复杂度如何分析递归代码的时间复杂度3.空间复杂度归并排序原理/核心思想:如果要排序一个数组,我们先把数组从中间分成前后两部分,然后对前后两部分分别排序,再将排好序的两部分合并在一起,这样整个数组就都有序了。归并排序使用的就是分治思想. 分治,顾名思义,就是分而治之,将一个大问题分解成小的子问题来解决。小的子问题解决了,大问题也就解决了递推公式原创 2020-06-02 16:10:53 · 220 阅读 · 0 评论 -
基于比较的排序算法之 冒泡, 插入, 选择
基于比较的排序算法之 冒泡, 插入, 选择冒泡排序、插入排序、选择排序这三种排序算法,它们的时间复杂度都是 O(n^2),比较高,适合小规模数据的排序。如何分析"排序算法"排序算法的执行效率1.最好情况, 最坏情况, 平均情况时间复杂度(1)分别给出最好情况、最坏情况、平均情况下的时间复杂度(2)最好、最坏时间复杂度对应的要排序的原始数据是什么样的.2.时间复杂度的系数、常数 、低阶我们知道,时间复杂度反应的是数据规模 n 很大的时候的一个增长趋势,所以它表示的时候会忽略系数、常数、低阶原创 2020-05-24 14:51:55 · 184 阅读 · 0 评论 -
数据结构与算法: 动态规划篇1 之0-1背包问题
动态规划 0-1背包问题0-1 背包问题动态规划: 优化前 (二维数组)动态规划: 优化后 (一维数组)0-1 背包问题升级版(引入物品价值)0-1 背包问题对于一组不同重量、不可分割的物品,我们需要选择一些装入背包,在满足背包最大重量限制的前提下,背包中物品总重量的最大值是多少呢?回溯的解决方法是穷举搜索所有可能的装法,然后找出满足条件的最大值。不过,回溯算法的复杂度比较高,是指数级别的, 复杂度为O(2^n)。递归树中的每个节点表示一种状态,我们用(i, cw)来表示。其中,i原创 2020-05-12 02:17:04 · 424 阅读 · 0 评论 -
笔记Andrew Ng:Machine Learning Week2
笔记Andrew Ng:Machine Learning Week2一、Linear Regression with Multiple Variables(1) Multivariate Linear RegressionMultiple FeaturesGradient Descent for Multiple Variablepython:compute Cost FunctionGradi...原创 2020-04-23 02:21:13 · 381 阅读 · 0 评论