![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
码码更快乐
分享即快乐
展开
-
机器学习基本概念
数据集(data set)记录的集合,假如我们用3个特征,分别为色泽,根蒂,响声来描述西瓜的特点,并且拿到了基于这3个特征的10万条记录,其中一条记录的取值为:色泽=光亮,根蒂=坚硬,响声=清亮如果记录到.csv文件中,这个文件的结构可以记为: fruit[100000][3] ,这样一个二维数组,行数为10万,列数为3(因为有3个特征)。示例(instance)每条记录是...原创 2018-08-31 18:43:45 · 274 阅读 · 0 评论 -
机器学习 特征选择
特征选择1、简介数据预处理完成以后,特征比较多时,就需要对特征进行选择。 使有意义的特征输入模型进行训练。 特征选择通常来说从两个方面入手:特征是否发散:特征如果不发散, 方差很小接近于0, 就意味着这个特征在所有样本中的分布是没有差异的, 说明这个特征对于样品区分没有贡献。 特征与目标相关项: 对于分类问题, 特征与分类目标相关性越大说明特征对于分类问题作用也就越大。特征选择的方...转载 2019-03-21 22:14:02 · 249 阅读 · 0 评论 -
机器学习 数据预处理(特征值转化)
数据预处理(特征值转化)1、简介我们知道,MNIST数据集中的样本特征是从0-255的灰度值,0表示白,而255表示黑,中间的数值代表不同深度的灰色。通过除以255的操作,我们可以把所有的特征值限定到0-1之间,从而有利于模型计算,提高模型的准确率,这就是一种简单的数据预处理(data preprocessing)。数据预处理的方法有那些呢,请看下文。Preprocessing dat...原创 2019-03-21 21:52:21 · 3964 阅读 · 0 评论 -
机器学习 数据表达与特征工程
数据表达与特征工程1、简介在机器学习里面,特征的选取与特征数据预处理十分重要,特征的准确性直接决定最终模型的准确性,而选择更好的训练模型只能为了更好的逼近预期值。特征工程就是对于原始数据进行数据预处理, 尽可能把可以把后续模型建立需要的特征提取出来。并把原始数据规整化,为后续建模做准备。类型特征(categorical features):有些特征值为字符串,比如:地理位置有的是 ...原创 2019-03-21 21:11:18 · 407 阅读 · 0 评论 -
机器学习 sklearn SVM
1、简介SVM:支持向量机(Support Vector Machines),通俗来讲,它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,其学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。目的:SVM 是一个面向数据的分类算法,它的目标是为确定一个分类超平面,从而将不同的数据分隔开大佬简易通俗理解SVM,强烈推荐看SVM具体实现和推导SVM基...原创 2018-10-31 15:25:38 · 433 阅读 · 0 评论 -
sklearn k最邻近算法
1、介绍k最邻近算法可以说是一个非常经典而且原理十分容易理解的算法,可以应用于分类和聚合。优点 : 1、简单,易于理解,易于实现,无需估计参数,无需训练; 2、适合对稀有事件进行分类; 3、特别适合于多分类问题(multi-modal,对象具有多个类别标签), kNN比SVM的表现要好;缺点: 1、对规模超...原创 2018-11-09 17:24:55 · 711 阅读 · 0 评论 -
图像处理 scikit-image、opencv、dlib简易整理
1、简介scikit-image:skimage包的全称是scikit-image SciKit (toolkit for SciPy) ,它对scipy.ndimage进行了扩展,提供了更多的图片处理功能。它是由python语言编写的,由scipy 社区开发和维护;skimage包由许多的子模块组成,各个子模块提供不同的功能;特点:轻量,易安装,易使用,轻量级opencv:OpenCV用...原创 2018-09-07 17:16:36 · 2727 阅读 · 0 评论 -
深度学习概念总结之TensorFlow
神经元(Neuron):是构成一个神经网络的最小单元算法网络结构:传统前向传播算法FP和反向传播算法BP等都是全连接网络结构;深度学习算法CNN,DNN等都是局部连接网络结构神经网络参数优化:一个最简单的神经元结构的输出就是所有输入的加权和,而不同输入的权重就是神经元的参数;神经元的优化过程就是优化神经元中参数取值的过程隐藏层(Hidden Layers):神经网络输入层和输出层中间的...原创 2018-08-23 11:33:34 · 433 阅读 · 1 评论 -
深度学习基础整理
学习深度学习的原因深度学习可以用更多的数据或是更好的算法来提高学习算法的结果。对于某些应用而言,深度学习在大数据集上的表现比其他机器学习(ML)方法都要好。 性能表现方面,深度学习探索了神经网络的概率空间,与其他工具相比,深度学习算法更适合无监督和半监督学习,更适合强特征提取,也更适合于图像识别领域、文本识别领域、语音识别领域等。 为什么深度学习会如此被热衷,因为它不以任何损失函数为特征,...原创 2018-08-28 10:30:13 · 276 阅读 · 0 评论 -
机器学习-基本数学概念
导数和偏导数解析:导数是指对X一个自变量求倒,偏导数是有两个或多个变量求倒导数:z=f(x,y)点(x0,y0)是其定义域D内一点.把y固定在y0而让x在x0有增量△x偏导数:△z=f(x0+△x,y0)-f(x0,y0),如果△z与△x之比当△x→0时的极限存在,那么此极限值称为函数z=f(x,y)在(x0,y0)处对x的偏导数.说明:几何意义上的理导数只是在二维平面上一条曲线上...转载 2018-08-20 20:24:18 · 411 阅读 · 0 评论 -
机器学习 降维
降维1、简介当特征选择完成后,可以直接训练模型了,但是可能由于特征矩阵过大,导致计算量大,训练时间长的问题,因此降低特征矩阵维度也是必不可少的。常见的降维方法除了以上提到的基于L1惩罚项的模型以外。另外还有主成分分析法(PCA)和线性判别分析(LDA),线性判别分析本身也是一个分类模型。PCA和LDA有很多的相似点,其本质是要将原始的样本映射到维度更低的样本空间中,但是PCA和LDA的映...原创 2019-03-21 22:17:07 · 247 阅读 · 0 评论