![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习算法
面朝大海zyp
这个作者很懒,什么都没留下…
展开
-
算法梳理(一)线性回归原理及实现
机器算法学习笔记(一)线性回归线性回归算法最小二乘法梯度下降法线性回归衡量方式数据归一化代码实现线性回归算法线性回归主要的用途是解决线性问题,蕴含着许多机器学习中的重要思想,是许多强大的非线性模型的基础。本文用来梳理一下自己理解的线性回归模型的一些知识,如有不当之处,还请指正。线性回归(Linear Regression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系...原创 2018-10-25 17:00:00 · 1168 阅读 · 2 评论 -
算法梳理(三)决策树
算法梳理(三)决策树一、概述二、划分选择熵联合熵条件熵信息增益基尼系数三、决策树的不同分类算法的原理及应用场景ID3算法C4.5算法CART树四、回归树原理五、防止过拟合手段预剪枝(Pre-Pruning)后剪枝(Post-Pruning)六、scikit-learn中决策树参数详解一、概述决策树是最简单的机器学习算法,它易于实现,可解释性强,完全符合人类的直观思维,有着广泛的应用。决策树到底...原创 2018-12-23 20:02:30 · 958 阅读 · 0 评论 -
算法梳理(二)逻辑回归原理及实现
算法梳理(二)逻辑回归原理及实现逻辑回归原理逻辑回归原理原创 2018-12-21 16:56:02 · 1363 阅读 · 0 评论 -
学习笔记(九)用IV值和随机森林挑选特征
学习笔记(九)用IV值和随机森林挑选特征特征筛选 (判定贷款用户是否逾期)1. IV值进行特征选择1.1 IV的计算1.1.1 WOE的计算1.2 IV的计算公式代码实现2. 随机森林进行特征选择1. 随机森林简单理解代码的实现总结数据是金融数据,我们要做的是预测贷款用户是否会逾期,表格中,status是标签:0表示未逾期,1表示逾期。Misson1 - 构建逻辑回归模型进行预测Misso...原创 2018-11-28 19:47:01 · 4397 阅读 · 0 评论 -
学习笔记(八)使用stacking模型融合
学习笔记(八)使用stacking模型融合x_temp = np.array(datafinal)y_temp = np.array(data_train)"""1.3 数据集的切分"""import sys sys.path.append(&quot原创 2018-11-26 16:14:02 · 6682 阅读 · 1 评论 -
学习笔记(七)模型的调参之网格搜索和交叉验证的简单应用
学习笔记(七)模型的调参之网格搜索和交叉验证的简单应用数据概述交叉验证1. Cross——Validation 交叉验证2. k折交叉验证(kfold)3.留一法Leave-one-out Cross-validation4.Shuffle-split cross-validation网格搜索1.逻辑回归的网格搜索2. 决策树的网格搜索3. svm的网格搜索4.XGboost的网格搜索5.ligh...原创 2018-11-24 17:05:10 · 4953 阅读 · 0 评论 -
scikit-learn--逻辑回归应用
sikit-learn--逻辑回归信息整理原创 2018-11-18 13:15:34 · 3864 阅读 · 1 评论 -
xgboost和lightgbm的模型建立
学习笔记(四)xgboost和lightgbm的模型建立数据是金融数据,我们要做的是预测贷款用户是否会逾期,表格中,status是标签:0表示未逾期,1表示逾期。构建xgboost和lightgbm进行预测(在构建部分数据需要进行缺失值处理和数据类型转换,如果不能处理,可以直接暴力删除)数据需求分析需要直接删除的数据Unnamed: 0 用户IDtrade_no:不知道是什么ban...原创 2018-11-17 21:53:54 · 1145 阅读 · 0 评论 -
学习笔记(五)5个常用模型的模型建立与评估
目录学习笔记(五)5个常用模型的模型建立与评估数据需求分析数据处理过程导入包(包括下面的xgboost和lightgbm)数据分析过程数据标准归一化使用逻辑回归进行预测使用SVM进行预测使用决策树进行预测使用xgboost进行预测使用lightgbm预测模型分析roc图表表格分析模型建立问题总结学习笔记(五)5个常用模型的模型建立与评估数据是金融数据,我们要做的是预测贷款用户是否会逾期,表格中...原创 2018-11-19 18:10:31 · 6424 阅读 · 1 评论 -
(预测贷款用户是否会逾期)支持向量机和决策树的模型建立
(预测贷款用户是否会逾期)支持向量机和决策树的模型建立数据是金融数据,我们要做的是预测贷款用户是否会逾期,表格中,status是标签:0表示未逾期,1表示逾期。【今天的任务】构建支持向量机和决策树模型进行预测(在构建部分数据需要进行缺失值处理和数据类型转换,如果不能处理,可以直接暴力删除)明确需要进行处理的数据需要直接删除的数据Unnamed: 0 用户IDtrade_no:不知道是...原创 2018-11-16 11:12:23 · 1208 阅读 · 0 评论 -
逻辑回归预测贷款用户是否会逾期
学习笔记(二)逻辑回归预测贷款用户是否会逾期算法实践能力的【整个思路】:构建模型——>模型融合——>模型评估——>交叉验证——>模型调参——>特征工程。【遵循】一次只做一件事,【先做再优化】的思路。每一个过程在完成任务的前提下,都可以拓展学习。【期望目标】掌握数据挖掘的流程,提升合作的能力。各位已经有经验,尤其是辅助的助教,还请多指导给大家的是金融数据,我们要做的...原创 2018-11-15 16:36:20 · 2728 阅读 · 1 评论 -
简述如何解决过拟合和最小二乘法的本质
简述如何解决过拟合和最小二乘法的本质1. 过拟合2. 如何防止过拟合2.1 从模型&数据角度2.1.1 数据增强&噪声数据2.1.2 简化模型2.2 从训练过程角度2.2.1 提前终止2.2.2 从正则化角度2.3 应对深度学习模型3. 最小二乘法本质3.1 概念1. 过拟合过拟合是指模型为了得到一致假设而使假设变得过于严格,也就是说模型对训练数据的学习有点过头。模型并没有学习...原创 2019-01-13 23:18:05 · 3385 阅读 · 0 评论