自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 机器学习初级篇16——常用的特征工程

机器学习初级篇16——常用的特征工程特征工程1.什么是特征工程2、异常数据的清洗和样本的选取3、数据预处理3.1无量纲化3.2 对定性特征进行独热编码3.4 缺失值的处理3.5 数据变换4、特征选择4.1 Filter4.2 Wrapper4.3 Embedded4.4 特征组合5、降维二、常用方法1. 时间戳处理2. 分解类别属性3.分箱/分区4. 交叉特征5. 特征选择6. 特征缩放7. 特征...

2019-11-14 22:06:46 592

原创 机器学习初级篇15——Bagging 和 Boosting的原理与区别

机器学习初级篇15——Bagging 和 Boosting的原理与区别一、集成学习综述1.Bagging2.Boosting3.Bagging,Boosting二者之间的区别一、集成学习综述集成学习(ensemble learning)通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统。准确性和多样性是集成学习的关键,准确性是基础,不难想象,几个比随机分类器效果还差的分类器组合...

2019-11-14 21:07:52 387

原创 机器学习初级篇14——理解SVM损失函数

机器学习初级篇14——理解SVM损失函数1、SVM损失函数图示2、SVM损失函数3、SVM损失函数理解SVM的损失函数是什么?怎么理解?1、SVM损失函数图示在学习支持向量机的过程中,我们知道其损失函数为合页损失函数。至于为什么叫这个名字,李航老师的《统计学习方法》上是这么说的:由于函数形状像一个合页,故命合页损失函数。下图为合页损失函数的图像(取自《统计学习方法》):横轴表示函数间隔,...

2019-11-14 20:50:49 442

原创 机器学习初级篇13——决策树的相关介绍

机器学习初级篇13——决策树的相关介绍决策树1.决策树理解:2.信息熵3.信息增益( ID3算法 )1.信息增益的理解2.信息增益的理解3.信息增益与条件熵4.信息增益比( C4.5算法 )5.基尼指数( CART算法 ---分类树)综述当我们需要对一个随机事件的概率分布进行预测时,我们的预测应当满足全部已知的条件,而对未知的情况不要做任何主观假设。在这种情况下,概率分布最均匀,预测的风险最小。...

2019-11-13 00:29:08 324

原创 机器学习初级篇12——浅谈向量的各种积

机器学习初级篇12——浅谈向量的各种积向量点乘(内积)和叉乘(外积、向量积)概念及几何意义解读一.点乘公式二.叉乘公式向量点乘(内积)和叉乘(外积、向量积)概念及几何意义解读向量是由n个实数组成的一个n行1列(n1)或一个1行n列(1n)的有序数组;向量的点乘,也叫向量的内积、数量积,对两个向量执行点乘运算,就是对这两个向量对应位一一相乘之后求和的操作,点乘的结果是一个标量。两个向量的叉乘...

2019-11-12 03:04:21 1028

原创 机器学习初级篇11——对SVM损失函数的理解

机器学习初级篇10——对SVM损失函数的理解对于SVM损失函数的理解一.对SVM损失函数概念的理解二.对SVM损失函数的深入了解对于SVM损失函数的理解一.对SVM损失函数概念的理解SVM的损失函数是什么?怎么理解在学习支持向量机的过程中,我们知道其损失函数为合页损失函数。至于为什么叫这个名字,李航老师的《统计学习方法》上是这么说的:由于函数形状像一个合页,故命合页损失函数。下图为合页损失...

2019-11-12 02:51:28 254 1

原创 机器学习初级篇10——对误差度量的理解

机器学习初级篇7——对误差度量的理解机器学习之对误差度量的理解一.对几个概念的理解1.:查准率(Precision)和查全率(Recall)机器学习之对误差度量的理解模型评估是对学习器泛化能力有效可行的实验估计方法。而性能度量是衡量模型泛化能力的评价标准。性能度量反应了任务需求,在对比不同模型能力时,使用不同的性能度量往往会导致不同的评估结果。模型的好坏不仅取决于算法和数据,还有任务需求。构...

2019-11-11 00:40:39 1020

原创 机器学习初级篇9——特征归一化

机器学习初级篇9——特征归一化特征归一化1.归一化与标准化的概念2.为什么需要对数值类型的特征做归一化?3.归一化的优点?1.加快了梯度下降求最优解的速度2.提升模型精度4.什么情况下必须进行归一化?5.怎么进行标准化/归一化?为了消除数据特征之间的量纲影响,我们需要对特征进行归一化处理,使得不同指标之间具有可比性。 例如,分析一个人的身高和体重对健康的影响 , 如果使用米( m) 和干克( k...

2019-11-10 22:51:14 464

原创 机器学习初级篇8——数据的编码方式

机器学习初级篇8——数据的编码方式一.变量的编码方式1.序号编码2.独热编码3.二进制编码3.哑变量编码方式二.哑变量编码与独热编码的区别与联系三.连续值的离散化为什么会提升模型的非线性能力?类别型特征( Categorical Feature ) 主要是指性别 (男、女)、血型( A 、 B、 AB 、 0 ) 等只在高限选I页内取值的特征。 类别型特征原始输入通常是字符串形式,除7决策树等少...

2019-11-10 21:59:11 3435 1

原创 机器学习初级篇7——数据离散化

机器学习初级篇7——数据离散化数据的离散化一.什么是数据的离散化二.为何要进行数据的离散化三.如何实现数据的离散化基本流程:1.对数据进行分组2.对分好组的数据求独热编码代码实现:四.总结1.对于离散化的解释:2.为什么进行数据的离散化:3.如何进行离散化:数据的离散化一.什么是数据的离散化连续属性的离散化就是将连续属性的值域上,将值域划分为若干个离散的区间,最后用不同的符号或整数值代表落在...

2019-11-10 20:03:21 1620

原创 机器学习初级篇6——极大似然与最小二乘法的关系与统一

机器学习初级篇6——极大似然与最小二乘法的关系与统一极大似然与最小二乘法一.极大似然估计二.最小二乘法三.极大似然估计与最小二乘法关系极大似然与最小二乘法一.极大似然估计在统计学中,最大似然估计(英语:maximum likelihood estimation,缩写为MLE),也称最大概似估计,是用来估计一个概率模型的参数的一种方法。(摘自维基百科)举个生活中最简单的栗子。假设袋子中有黑...

2019-11-08 06:42:47 1146

原创 机器学习之最大似然与最大后验的理解

机器学习初级篇5——对最大似然估计与最大后验的理解机器学习之最大似然与最大后验的理解一.MLE(最大似然估计)1. 最大似然估计的概念:1.对最大似然估计的理解:2.先验分布与后验分布:3.密度函数2.最大似然估计法的基本思想3.理解对数似然估计函数值二.MAP(最大后验估计)机器学习之最大似然与最大后验的理解一.MLE(最大似然估计)在参数估计中有一类方法叫做“最大似然估计”,因为涉及到的...

2019-11-08 06:20:31 1222

原创 机器学习4—特征向量与特征值

机器学习4—特征向量与特征值对特征向量与特征值的理解基本概念计算A的特征值与特征向量特征向量与特征值的意义特征值和特征向量的应用对特征向量与特征值的理解基本概念A为n阶矩阵,若数λ和n维非0列向量x满足Ax=λx,那么数λ称为A的特征值,x称为A的对应于特征值λ的特征向量。式Ax=λx也可写成( A-λE)x=0,并且|λE-A|叫做A 的特征多项式。当特征多项式等于0的时候,称为A的特征方...

2019-11-07 06:52:38 4954

原创 机器学习初级篇3——拟合问题与正则化问题的理解

机器学习初级篇3——过拟合问题拟合与正则化问题的理解一.几个基本的概念1.过拟合:过拟合(overfitting),也叫高方差(variance)。2.欠拟合: 欠拟合(underfitting),或者叫作叫做高偏差(bias)。3.泛化性:泛化是指一个假设模型能够应用到新样本的能力。4.高偏差与高方差二.过拟合产生的原因三.过拟合的应对的解决措施如何处理过拟合?1.L1/L2正则化2. 数据增强...

2019-11-06 23:52:56 619

原创 机器学习之用python分析梯度

机器学习初级篇2——python分析机器学习之梯度下降求解线性回归问题一.应用sklearn包求解线性回归求解步骤:1.导入相关模块:2.准备工作:3.生成一个模型并进行画图:4.添加新特征并创建测试数据:5.拟合训练数据:6.对测试集进行预测:二.应用批量梯度下降求解线性回归(Batch Gradient Descent)三.应用随机梯度下降求解线性回归(Stochastic Gradient ...

2019-11-05 23:57:55 527

原创 机器学习初级篇1

机器学习1机器学习机器学习的应用机器学习的定义常见的几个概念机器学习的分类机器学习的基本流程机器学习的三要素机器学习的算法原理三个重要公式:1.决策函数:2.损失函数3.算法公式:梯度下降三种方式1.批量梯度下降法(Batch Gradient Descent):2.随机梯度下降法(Stochastic Gradient Descent):3.小批量梯度下降法(mini Batch Gradien...

2019-11-04 23:15:15 235

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除