自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 python天气数据爬虫以及可视化

爬完数据后进行分析和可视化。

2024-07-10 11:09:15 202

原创 XGBoost算法案例 - 信用评分模型

这里唯一需要注意的是最后一行代码中的scoring参数需要设置成'r2',其表示的是R-squared值,因为是回归模型,所以参数调优时应该选择R-squared值来进行评判,而不是分类模型中常用的准确度'accuracy'或者ROC曲线对应的AUC值'roc_auc'。为了降低不良贷款率,保障自身资金安全,提高风险控制水平,银行等金融机构会根据客户的信用历史资料构建信用评分模型给客户评分。根据客户的信用得分,可以估计客户按时还款的可能,并据此决定是否发放贷款及贷款的额度和利率。

2024-07-08 17:14:13 314

原创 XGBoost算法案例实战-金融反欺诈模型

出现这种情况的原因是因为交叉验证,我们来简单回顾下K折交叉验证的思路:它是将原来的测试数据分为K份(这里cv=5,即5份),然后在这K份数据中,选K-1份作为训练数据,剩下的1份作为测试数据,训练K次,获得K个的ROC曲线下的AUC值,然后将K个AUC值取平均,取AUC值的均值为最大情况下的参数为模型的最优参数。注意这里AUC值的获取是基于训练集数据,只不过是将训练集数据中的1/K作为测试集数据,这里的测试集数据并不是真正的测试集数据y_test,这也是为什么参数调优后结果反而不如不调优的结果的原因。

2024-07-08 16:57:05 335

原创 SQL小白处理数据的一些记录

select * from "QY_QYJBXX" /*查询企业名称重复的数据*/where QYMC in (select QYMC from QY_QYJBXX group by QYMC having count(QYMC) > 1)SELECT QYMC,RCKTC FROM "QY_QYJBXX"where QYMC like '%有限公司%' and QYMC like '%[^0-9]%' DELETE JCSJR.QY_QYJBXX WHERE QYMC...

2021-09-14 16:46:22 62

XGBoost算法案例 - 信用评分模型

用来做python模型学习

2024-07-08

信用卡交易数据,用来做模型学习

信用卡交易数据

2024-07-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除