自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 大厂SQL面试题,连续时间问题

今天分享一个非常常考,同时也不太容易的sql题目类型,求连续时间问题。这类题的核心是:分组排序,用时间减去排序,如果连续的话他们的差会是相同值记住下面的表,按照提供的三步思路理清楚里面的数据逻辑,连续时间问题再不会难到你思路:求解连续天数是面试时非常常考的问题,这类问题有非常巧妙的统一解法,分为3步:1、为日期排序row number() over (partition by use_id order by date) as rank2、求日期和排序的差值(diff)因为日期存在周期

2021-07-08 12:37:25 2249

转载 风控模型师面试准备--技术篇

风控模型师面试准备–技术篇–访问原文风控模型师面试准备–技术篇一.算法 逻辑回归 决策树 集成学习(随机森林,Adaboost,GBDT,XGBOOST,LightGbm)二.特征工程三.模型评估与优化一. 算法1.逻辑回归 Q : 逻辑回归的优缺点,在金融领域相比其他算法有什么优势,局限性在哪?1)优点:实现简单,速度快,占用内存小,可在短时间内迭代多个版本的模型。模型的可解释性非常好,可以直接看到各个特征对模型结果的影响,可解释性在金融领域非常重要,所以在目前业界大部分使用的仍是逻

2021-01-29 16:56:25 540

原创 MYSQL 两个经纬度之间的距离(单位:米),风控指标

两个经纬度之间的距离计算公式对上面的公式解释如下:Lng1 Lat1表示A点经纬度, Lng2 Lat2表示B点经纬度;a=Lat1 – Lat2 为两点纬度之差 b=Lng1 -Lng2 为两点经度之差;6378.137为地球半径,单位为千米;计算出来的结果单位为千米,若将半径改为米为单位则计算的结果单位为米。计算精度与谷歌地图的距离精度差不多,相差范围在0.2米以下。公式如下,单位米: 第一点A经纬度:lng1 lat1 第二点B经纬度:lng2 lat2 mysql

2020-08-05 11:43:56 842

原创 sklearn 用 pickle 或 joblib 保存模型并加载使用

训练了 sklearn 模型后,希望有一种方法可以持久保存模型以备将来使用,而不必重新训练。以下部分为您提供了一个示例,说明如何使用pickle持久化模型。在处理pickle序列化时,我们还将回顾一些安全性和可维护性问题。使用Python的内置持久性模型pickle可以将模型保存在scikit-learn中:pickle 保存模型并加载使用from sklearn import svmfrom sklearn import datasetsmodel_xgb = svm.SVC()X, y=

2020-07-14 20:32:20 3566

原创 python连接MySQL数据库,查询数据后定时邮件发送数据

这是我第一次写的代码:python连接MySQL数据库,查询数据后定时邮件发送数据,纯python代码。首先用python连接MySQL数据库,查询出数据后转成DataFrame格式数据,再制作成网页版,构建成邮件,设置好定时时间,直接可以多人发送。python连接MySQL数据库;python定时邮件发送。话不多说直接上代码:# 导入相关库-emailfrom email.mime....

2020-02-25 14:05:40 1576 2

原创 python中的apply(),applymap(),map() 的用法和区别

在Python中如果想要对数据使用函数,可以借助apply(),applymap(),map() 来应用函数,括号里面可以是直接函数式,或者自定义函数(def)或者匿名函数(lambad)import pandas as pdimport numpy as npfrom pandas import DataFramefrom pandas import Seriesdf1= DataFr...

2020-01-09 17:16:29 172

原创 MongoDB 常用语句

use 数据库名 进入数据库 若数据库不存在,创建数据库db 显示当前数据库show dbs 显示内容非空的数据库db.createCollection(‘表名’) 创建不限长度的表db.createCollection(‘表名’ ,{capped:true,size:1000}) 创建限制长度的表db.表名.drop() 删除集合show co...

2019-12-03 17:15:53 250

原创 mysql计算特定字符串在长字符串中出现次数

mysql计算字符串在长字符串中出现次数完成此项功能需要两个函数1.REPLACE(字段名称,字符串1,字符串2) //将字段中的字符串1替换成字符串22.CHAR_LENGTH(字符串)//计算字符串长度不管汉字还是数字或者是字母都算是一个字符ps:LENGTH(字符串)也能计算但计算的是字节长度,注意区分实现思路:将长字符串长度中出现短字符串的位置替换成空(注意是空’'不是空格)再...

2019-12-02 16:11:36 685

原创 风控模型评估指标:KS、ROC、AUC、PSI代码逻辑

上图中,我们最常用的就是TPR(True Positive Rate)和FPR(False Positive Rate):其中:TPR = TP/(TP+FN)即真实1中预测错的;FPR = FP/(FP+TN)即真实0中预测错的;Precision = TP/(TP+FP)即预测1中对的最理想的模型,是TPR尽量高而FPR尽量低,然而任何模型在提高正确预测概率的同时,也会难以避免地增...

2019-11-29 15:03:18 5473

原创 LightGBM 如何调参

本文结构:什么是 LightGBM怎么调参和 xgboost 的代码比较

2019-11-27 10:06:38 1669

原创 python (PSI)模型分和特征稳定性评估指标

@[TOC](python (PSI)模型分和特征稳定性评估指标)由于模型是以特定时期的样本所开发的,此模型是否适用于开发样本之外的族群,必须经过稳定性测试才能得知。稳定度指标(population stability index ,PSI)可衡量测试样本及模型开发样本评分的的分布差异,为最常见的模型稳定度评估指针。其实PSI表示的就是按分数分档后,针对不同样本,或者不同时间的样本,popula...

2019-11-26 10:05:32 9286 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除