- 博客(8)
- 收藏
- 关注
原创 什么是机器学习
什么是机器学习机器学习的应用场景机器学习中的基本概念机器学习中的常见算法对数据进行处理的技巧有监督学习与无监督学习模型的泛化、过拟合与欠拟合机器学习的应用场景1、电子商务中的智能推荐淘宝通过用户的浏览记录和购买记录,对用户行为进行预测,进行产品推荐2、社交网络中的效果广告如果用户经常点赞或者转发某类型的微博或视频,系统就会将该类型的广告展示给用户3、互联网金融中的风控系统银行等金融机...
2019-09-09 00:34:23 180 1
原创 贷款用户逾期问题Task4
贷款用户逾期问题Task4任务4 - 模型评估(2天)任务4 - 模型评估(2天)任务4:记录5个模型(逻辑回归、SVM、决策树、随机森林、XGBoost)关于accuracy、precision,recall和F1-score、auc值的评分表格,并画出ROC曲线。时间:2天可以参照以下格式:图片: ...
2019-08-16 00:47:04 157
原创 Mysql学习内容
Mysql任务2-4天MySQL 基础 (二)- 表操作学习内容作业#项目三解答MySQL 基础 (二)- 表操作学习内容作业#项目三项目三:超过5名学生的课(难度:简单)创建如下所示的courses 表 ,有: student (学生) 和 class (课程)。例如,表:±--------±-----------+| student | class |±-----...
2019-08-11 21:28:50 402
原创 贷款用户逾期问题Task3
贷款用户逾期问题Task3任务3 - 建模(2天)逻辑回归LR支持向量机SVM决策树任务3 - 建模(2天)用逻辑回归、svm和决策树;随机森林和XGBoost进行模型构建,评分方式任意,如准确率等。(不需要考虑模型调参)时间: 2天逻辑回归LR逻辑回归,即广义线性回归模型。这是因为普通线性回归自身的特点,非常容易出现过拟合的现象。from sklearn.linear_model i...
2019-08-11 20:21:57 141
原创 贷款用户逾期问题Task2
贷款用户逾期问题Task2任务2 - 特征工程(2天)特征衍生特征挑选具体实现任务2 - 特征工程(2天)特征衍生特征挑选:分别用IV值和随机森林等进行特征选择……以及你能想到特征工程处理特征衍生特征衍生,指利用现有的特征进行某种组合生成新的特征,主要是从业务数据和纯技术生产特征方面着手。特征挑选通常我们在清洗数据后,需要进行分箱、计算WOE和IV值(WOE的性质)、特征筛选。1...
2019-08-08 21:11:58 205
原创 MySQL实操学习(一)
组队学习mysql#任务一查找重复的电子邮箱(难度:简单)创建 email表,并插入如下三行数据±—±--------+| Id | Email |±—±--------+| 1 | a@b.com || 2 | c@d.com || 3 | a@b.com |±—±--------+编写一个 SQL 查询,查找 Email 表中所有重复的电子邮箱。根据以上输入,...
2019-08-07 19:20:53 949
原创 贷款用户逾期问题Task1
贷款用户逾期问题#引言这是数据挖掘组队学习的一个任务,简单说明:这份数据集是金融数据(非原始数据,已经处理过了),我们要做的是预测贷款用户是否会逾期。表格中 “status” 是结果标签:0表示未逾期,1表示逾期。要求:数据切分方式 - 三七分,其中测试集30%,训练集70%,随机种子设置为2018任务1:对数据进行探索和分析。时间:2天数据类型的分析无关特征删除数据类型转换缺失值...
2019-08-06 13:38:24 346
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人