![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
wutong14220
这个作者很懒,什么都没留下…
展开
-
贷款用户逾期问题Task1
贷款用户逾期问题 #引言 这是数据挖掘组队学习的一个任务,简单说明:这份数据集是金融数据(非原始数据,已经处理过了),我们要做的是预测贷款用户是否会逾期。表格中 “status” 是结果标签:0表示未逾期,1表示逾期。 要求:数据切分方式 - 三七分,其中测试集30%,训练集70%,随机种子设置为2018 任务1:对数据进行探索和分析。时间:2天 数据类型的分析 无关特征删除 数据类型转换 缺失值...原创 2019-08-06 13:38:24 · 335 阅读 · 0 评论 -
贷款用户逾期问题Task4
贷款用户逾期问题Task4任务4 - 模型评估(2天) 任务4 - 模型评估(2天) 任务4:记录5个模型(逻辑回归、SVM、决策树、随机森林、XGBoost)关于accuracy、precision,recall和F1-score、auc值的评分表格,并画出ROC曲线。 时间:2天 可以参照以下格式: 图片: ...原创 2019-08-16 00:47:04 · 147 阅读 · 0 评论 -
贷款用户逾期问题Task3
贷款用户逾期问题Task3任务3 - 建模(2天)逻辑回归LR支持向量机SVM决策树 任务3 - 建模(2天) 用逻辑回归、svm和决策树;随机森林和XGBoost进行模型构建,评分方式任意,如准确率等。(不需要考虑模型调参) 时间: 2天 逻辑回归LR 逻辑回归,即广义线性回归模型。这是因为普通线性回归自身的特点,非常容易出现过拟合的现象。 from sklearn.linear_model i...原创 2019-08-11 20:21:57 · 129 阅读 · 0 评论 -
贷款用户逾期问题Task2
贷款用户逾期问题Task2任务2 - 特征工程(2天)特征衍生特征挑选具体实现 任务2 - 特征工程(2天) 特征衍生 特征挑选:分别用IV值和随机森林等进行特征选择 ……以及你能想到特征工程处理 特征衍生 特征衍生,指利用现有的特征进行某种组合生成新的特征,主要是从业务数据和纯技术生产特征方面着手。 特征挑选 通常我们在清洗数据后,需要进行分箱、计算WOE和IV值(WOE的性质)、特征筛选。 1...原创 2019-08-08 21:11:58 · 193 阅读 · 0 评论 -
什么是机器学习
什么是机器学习机器学习的应用场景机器学习中的基本概念机器学习中的常见算法对数据进行处理的技巧有监督学习与无监督学习模型的泛化、过拟合与欠拟合 机器学习的应用场景 1、电子商务中的智能推荐 淘宝通过用户的浏览记录和购买记录,对用户行为进行预测,进行产品推荐 2、社交网络中的效果广告 如果用户经常点赞或者转发某类型的微博或视频,系统就会将该类型的广告展示给用户 3、互联网金融中的风控系统 银行等金融机...原创 2019-09-09 00:34:23 · 169 阅读 · 1 评论