自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 资源 (1)
  • 收藏
  • 关注

转载 【转载】用XGBoost解释机器学习

 【转载】用XGBoost解释机器学习。  来源:Scott Lundberg,来源:数据派THU 本文长度为4300字,建议阅读8分钟 本文为大家介绍用XGBoost解释机器学习。 这是一个故事,关于错误地解释机器学习模型的危险以及正确解释所带来的价值。如果你发现梯度提升或随机森林之类的集成树模型具有很稳定的准确率,但还是需要对其进行解释,那我希望你能从这篇文章有所收获。 &n...

2020-10-06 21:02:44 292

原创 【天池】金融风控贷款违约预测task5

【天池】金融风控贷款违约预测task5task5学习总结:1)简单平均和加权平均是常用的两种比赛中模型融合的方式。其优点是快速、简单。2)stacking在众多比赛中大杀四方,但是跑过代码的小伙伴想必能感受到速度之慢,同时stacking多层提升幅度并不能抵消其带来的时间和内存消耗,所以实际环境中应用还是有一定的难度。3)当然在比赛中将加权平均、stacking、blending等混用也是一种策略。# task5 模型融合# 方法:1)平均:简单、加权;2)投票:简单、加权;3)综合:排序融合、

2020-09-27 21:39:52 373

原创 【天池】贷款违规风险预测task4

# lightGBM方法简单建模待调参完善# 本地验证 0.7315930724616382# lightGBM方法import pandas as pdimport numpy as npfrom category_encoders.target_encoder import TargetEncoderfrom sklearn.model_selection import KFoldfrom sklearn.metrics import auc, roc_curvefrom light

2020-09-24 21:17:00 366 1

原创 【天池】贷款违约预测task3

【天池】贷款违约预测task3——特征工程篇阶段目标:1)特征预处理:包括缺失值处理、异常值处理、特征分框;2)特征编码:对象型特征编码、特征归一化等;3)特征筛选:过滤无用特征(卡方、相关系数、正则化项等);4)简单建模:XGBoost、LightGBM# 3阶段目标 特征工程# 特征预处理、缺失值异常值处理、数据分桶# 特征交互、编码import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport se

2020-09-21 11:56:35 561

原创 python爬虫学习

python爬取当当页面数据import requestsfrom pyquery import PyQueryimport csvimport time# 当当网爬虫测试class DDSpider(object): def __init__(self,key): self.key = key self.headers = { 'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) App

2020-09-19 19:32:28 1517

原创 【天池】金融风控数据挖掘task2

Task2 探索性数据分析此部分为零基础入门金融风控的 Task2 数据分析部分,带你来了解数据,熟悉数据,为后续的特征工程做准备,代码如下:import pandas as pdimport numpy as nptrain = pd.read_csv(r'/home/corn/桌面/tianchifengkong/train.csv')testA = pd.read_csv(r'/home/corn/桌面/tianchifengkong/testA.csv')print('Train

2020-09-18 17:53:46 306

原创 【天池】金融风控数据挖掘task1

天池金融风控数据挖掘task11.赛题理解赛题以预测金融风险为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时会对employmentTitle、purpose、postCode和title等信息进行脱敏。2.赛题流程3. 评价指标3.1 分类算法常用1)混淆矩阵、2)准确率(Accuracy)、精确率(Preci

2020-09-15 13:56:20 228

原创 ubuntu 16.04安装软件包出现wine包依赖问题

问题描述:ubuntu16.04在使用apt-get install softname命令安装软件包时出现依赖问题,使用apt-get -f install 报错wine包无法修复下列软件包有未满足的依赖关系:wine1.8-amd64 : 依赖: wine1.8:any (= 1:1.8.0-0ubuntu1~ubuntu15.10.1~ppa1) 推荐: libgif4 但无法安装它 推荐: libgnutls26 ...

2020-09-15 10:19:36 1169

转载 spyder设置关闭UMR之后,重启黑屏问题解决

1. cd /etc/ld.so.conf.d 进入到当前目录.2. sudo cat x86_64-linux-gnu_GL.conf显示以下结果:/usr/lib/nvidia-384/usr/lib32/nvidia-3843. sudo vim i386-linux-gnu_GL.conf ,将以上结果复制进来保存退出.4. sudo ldconfig 进行动态链接...

2019-12-11 21:59:44 268

原创 ubuntu中利用anaconda快速配置pytorch,及网络源连接失败问题解决

在ubuntu中利用anaconda可以方便快速的配置pytorch。具体步骤如下:1.安装anacondabash Anconda3-x.x.x-Linux-x86_64.sh2.创建python虚拟环境,这里是python3.6,环境名自拟。conda create -n <your-virtualenv-name> python=3.63.激活进入虚拟环境sou...

2019-12-10 22:28:41 479

转载 利用gparted给ubuntu16.04空间扩容

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声...

2019-12-04 17:32:30 869

转载 ubuntu16.04 启动U盘制作与系统安装

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声...

2019-12-04 17:27:36 922

武汉大学数值分析试题.rar

其中05-11为文档,其他为照片

2019-12-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除