自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 资源 (2)
  • 收藏
  • 关注

原创 拍拍贷风控违约预测

拍拍贷风控违约预测项目背景介绍国内网络借贷行业的贷款风险数据1.包括信用违约标签(因变量)2.建模所需的基础与加⼯字段(自变量)3.相关用户的网络行为原始数据本着保护借款⼈隐私以及拍拍贷知识产权的目的,数据字段已经过脱敏处理。数据信息Master(每一行代表一个成功成交借款样本,每个样本包含200多个各类字段。1.idx:每笔贷款的unique key,可与另外2个文件里的idx相匹配。2.UserInfo_*:借款人特征字段3.WeblogInfo_*:Info网络行为字段

2021-03-16 06:00:52 1151 1

原创 住房月租金预测

住房月租金预测项目介绍项目目的当今社会,房屋租金由装修情况、位置地段、户型格局、交通便利程度、市场供需量等多方面因素综合决定,对于租房这个相对传统的行业来说,信息严重不对称一直存在。一方面,房东不了解租房的市场真实价格,只能忍痛空置高租金的房屋;另一方面,租客也找不到满足自己需求高性价比房屋,这造成了租房资源的极大浪费。本项目基于租房市场的痛点,提供脱敏处理后的真实租房市场数据。选手需要利用有月租金标签的历史数据建立模型,实现基于房屋基本信息的住房月租金预测,为该城市租房市场提供客观衡量标准。

2021-03-16 05:21:47 1116 2

原创 迁移学习在风控建模冷启动中的应用(简介)

迁移学习在风控建模冷启动中的应用(简介)目录迁移学习在风控建模冷启动中的应用(简介)背景与文献回顾基础理论介绍迁移学习概念迁移学习方法实证分析实验结论与局限性现状与展望背景与文献回顾背景风控在国家层面的重要性三大攻坚战的“作战图”,其中之一就是推动重大风险防范化解取得明显进展。 2020年是进行防范化解金融风险目标的收官之年。风控在金融机构层面的重要性信贷风险控制是贷款机构的生存之本,也是提高收益的关键。互联网金融风控体系互联网...

2021-03-16 05:21:15 1337 1

原创 互联网金融信用评分卡模型构建

互联网金融信用评分卡模型构建背景介绍信用风险计量体系包括主体评级模型和债项评级两部分。主体评级和债项评级均有一系列评级模型组成,其中主体评级模型可用“四张卡”来表示,分别是A卡、B卡、C卡和F卡;债项评级模型通常按照主体的融资用途,分为企业融资模型、现金流融资模型和项目融资模型等。 我们主要讨论主体评级模型的开发过程。项目流程典型的信用评分模型如图1-1所示。信用风险评级模型的主要开发流程如下:(1) 数据获取,包括获取存量客户及潜在客户的数据。存量客户是指已经在证券公司开展相关融资类业务的客

2021-03-15 23:51:18 771

原创 kaggle住房预测项目——第4部分(其他数据预处理方法)

kaggle住房预测项目——第4部分(其他数据预处理方法)import numpy as npimport pandas as pd%matplotlib inlineimport matplotlib.pyplot as pltimport seaborn as snscolor = sns.color_palette()sns.set_style('darkgrid')from scipy import statsfrom scipy.stats import norm, skew

2021-03-15 23:00:08 1299 1

原创 kaggle住房预测项目——第3部分(stacking)

kaggle住房预测项目——第3部分(stacking)import numpy as npimport pandas as pdimport randomimport datetimeimport copyfrom sklearn.metrics import make_scorerfrom sklearn.metrics import mean_squared_log_errorfrom sklearn.model_selection import GridSearchCVimport

2021-03-15 22:42:38 910 1

原创 kaggle住房预测项目——第2部分(bagging)

kaggle住房预测项目——第2部分基线模型import xgboost as xgbimport copyimport datetime,timefrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import mean_squared_log_error4from sklearn.metrics import make_scorerdef xgb_eval(data): def my

2021-03-15 18:42:16 1485

原创 kaggle住房预测项目——第1部分

kaggle住房预测项目——第1部分项目介绍项目地址项目目的数据介绍目标:预测每个房屋的销售价格是您的工作。对于测试集中的每个ID,您必须预测SalePrice变量的值。评估指标根据预测值的对数与观察到的销售价格的对数之间的均方根误差(RMSE)评估提交的内容。(记录日志意味着预测昂贵房屋和廉价房屋的错误将同等地影响结果。)加载数据集导入工具包,数据读取import pandas as pdimport numpy as npimport matplotlib.pyplot as p

2021-03-15 17:54:54 1222

原创 机器学习小知识点系列:sklearn.model_selection.KFold

机器学习小知识点系列:sklearn.model_selection.KFoldKFoldParametersn_splits : int, default=5shuffle : bool, default=Falserandom_state : int or RandomState instance, default=NoneMethodsget_n_splits(X=None, y=None, groups=None)split(X, y=None, groups=None)ExamplesKFold

2020-10-13 23:46:31 444

原创 django项目如何部署到阿里云服务器

django项目如何部署到阿里云服务器阿里云服务器购买在阿里云上搭建项目及安装数据库使用Git bash将本地项目文件推送到github远程仓库将github仓库导入阿里云安装依赖安装数据库如何将本地的数据库内容导入到阿里云呢?mysql问题Navicat测试连接阿里云Mysql修改settings.py文件uwsgi和nginx的部署搭建uwsgi启动项目如果端口被占用了,或者说如何重新部署项目现在我们先默认项目长这样:你的项目名/├── 你的项目名│ ├── __init__.py│

2020-06-09 23:16:38 778

原创 数据结构与算法: 排序之归并排序

数据结构与算法: 排序之归并排序归并排序原理/核心思想:递推公式伪代码merge函数具体过程:伪代码:python代码三个问题1.是否是稳定的排序算法2.时间复杂度如何分析递归代码的时间复杂度3.空间复杂度归并排序原理/核心思想:如果要排序一个数组,我们先把数组从中间分成前后两部分,然后对前后两部分分别排序,再将排好序的两部分合并在一起,这样整个数组就都有序了。归并排序使用的就是分治思想. 分治,顾名思义,就是分而治之,将一个大问题分解成小的子问题来解决。小的子问题解决了,大问题也就解决了递推公式

2020-06-02 16:10:53 223

原创 基于比较的排序算法之 冒泡, 插入, 选择

基于比较的排序算法之 冒泡, 插入, 选择冒泡排序、插入排序、选择排序这三种排序算法,它们的时间复杂度都是 O(n^2),比较高,适合小规模数据的排序。如何分析"排序算法"排序算法的执行效率1.最好情况, 最坏情况, 平均情况时间复杂度(1)分别给出最好情况、最坏情况、平均情况下的时间复杂度(2)最好、最坏时间复杂度对应的要排序的原始数据是什么样的.2.时间复杂度的系数、常数 、低阶我们知道,时间复杂度反应的是数据规模 n 很大的时候的一个增长趋势,所以它表示的时候会忽略系数、常数、低阶

2020-05-24 14:51:55 184

原创 数据结构与算法: 动态规划篇1 之0-1背包问题

动态规划 0-1背包问题0-1 背包问题动态规划: 优化前 (二维数组)动态规划: 优化后 (一维数组)0-1 背包问题升级版(引入物品价值)0-1 背包问题对于一组不同重量、不可分割的物品,我们需要选择一些装入背包,在满足背包最大重量限制的前提下,背包中物品总重量的最大值是多少呢?回溯的解决方法是穷举搜索所有可能的装法,然后找出满足条件的最大值。不过,回溯算法的复杂度比较高,是指数级别的, 复杂度为O(2^n)。递归树中的每个节点表示一种状态,我们用(i, cw)来表示。其中,i

2020-05-12 02:17:04 425

原创 数据结构与算法——2数组, 链表

数据结构与算法——2数组, 链表数组定义如何实现随机访问低效的"插入"和"删除"插入操作删除操作警惕数组的访问越界问题容器能否完全替代数组?内容小结链表链表与数组的简单区别常见的链表结构单链表基本概念数据的查找、插入和删除操作插入和删除(优势):随机访问(劣势):循环链表优点双向链表相比单链表,双向链表适合解决哪种问题呢?插入,删除操作中的优势对于一个有序链表,双向链表的按值查询的效率也要比单链表...

2020-05-01 21:29:02 405

原创 数据结构与算法——1复杂度分析

数据结构与算法:1复杂度分析复杂度分析一. 如何分析,统计算法的执行效率和资源消耗?1. 为什么需要复杂度分析?事后统计法的局限性:2.大 O 复杂度表示法与时间复杂度分析三个实用的方法几种常见时间复杂度实例分析3.空间复杂度分析4.内容小结二. 最好、最坏、平均、均摊时间复杂度最好、最坏情况时间复杂度平均情况时间复杂度均摊时间复杂度以及摊还分析(平摊分析)均摊时间复杂度应用场景练习:复杂度分析...

2020-05-01 01:47:57 177

原创 笔记Andrew Ng:Machine Learning Week2

笔记Andrew Ng:Machine Learning Week2一、Linear Regression with Multiple Variables(1) Multivariate Linear RegressionMultiple FeaturesGradient Descent for Multiple Variablepython:compute Cost FunctionGradi...

2020-04-23 02:21:13 382

原创 笔记Andrew Ng:Machine Learning Week1

IntroductionWhat is Machine LearningdefinitionArthur Samuel:(an older, informal definition)the field of study that gives computers the ability to learn without being explicitly programmed.Tom M...

2020-04-23 02:05:29 243

Pydroid 3.apk (版本更新日期 2019年10月27日, 截止2020/5/10 为最新)

内含3个apk,pydroid 3.apk是必须安装的,其他两个为可选项(各自有一点多MB) google商店版 Pydroid 3.apk - IDE for Python 3 Pydroid permissions plugin.apk(除非其他应用程序要求,否则请勿安装此应用程序。使用此应用程序来扩展Pydroid的权限。如果您的程序使用相机,蓝牙,录音等,则需要这样做) Pydroid repository plugin.apk(除非其他应用程序要求,否则请勿安装此应用程序。 Pydroid存储库插件提供了一个带有预构建软件包的快速安装存储库,其中包含本机库。它的唯一目的是允许Pydroid在下载可执行代码时遵守开发者计划政策。您可能会发现为此安装单独的应用程序不方便,但这是目前唯一允许的方式。如果您无法安装此插件,您仍然可以通过取消使用“使用预构建库存储库”选项从其源代码构建库(这将花费大量时间并可能需要手动安装依赖项)。除非在包许可中另有说明,否则不允许任何与Pydroid无关的应用程序使用这些程序包(在其中启动的程序被认为是相关的)。

2020-05-10

Termux.apk (版本更新日期 2020年3月25日)

Termux (更新日期 2020年3月25日) google商店版本 直接下载安装即可 Termux是一个Android下一个高级的终端模拟器, 开源且不需要root, 支持apt管理软件包,十分方便安装软件包, 完美支持Python, PHP, Ruby, Go, Nodejs, MySQL等。

2020-05-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除