![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
Jeremy_lf
知所先后
展开
-
Sift特征提取算法
2004 年D.Lowe 提出了一个新的算法:尺度不变特征变换(SIFT),这个算法可以帮助我们提取图像中的关键点并计算它们的描述符。SIFT算法的特点就是,对于局部特征对旋转、缩放、亮度变化保持不变。SIFT 算法主要内容如下:(1)尺度空间的极值检测(2)特征点定位(3)特征方向赋值(4)特征点的描述1、尺度空间——建立统一的认知,考虑多尺度多分辨率图像金字塔:a、对原图进行平...原创 2020-02-16 21:42:43 · 623 阅读 · 0 评论 -
Numpy数据库中random.rand、random.randn、random.randint区别
random.rand是随机生成范围为(0,1)的数据,如下:import numpy as npimport pandas as pdimport random>>> s=pd.DataFrame(np.random.rand(5,4))>>> s 0 1 2 30 0.3448...原创 2018-12-10 14:54:31 · 1607 阅读 · 1 评论 -
机器学习之模型常用评估方法
一、留出法定义:直接将集合划分为两个互斥的集合,其中一个作为训练集合,一个作为测试集合1、测试集合和训练集合尽可能保持数据分布的一致性,比如要保证正反样本的比例不变2、在给定了训练/测试集合的样本比例之后,仍要存在多种的划分方式,对数据集合D进行分割。二、交叉验证法(无放回的重采样)定义:将数据集D划分为k个大小相似的互斥子集。每次利用k-1个子集进行训练,然后用剩下的那个子集作为测试集,这样就可以获得k组训练/测试集,最终返回的是k个结果的均值。有一个特例留一法。在处理较小的数据集合的时候我们原创 2020-07-15 00:04:11 · 1520 阅读 · 0 评论 -
机器学习算法之Bagging与RF详解
之前我们已经介绍过Boosting算法,是通过对训练集进行采样,产生不同的独立的子集,然后再训练出一个基学习器,通过集成可以得到一个泛化能力强的模型。但为了有更好的集成,我们希望个体学习器之间的差异不能太大,否则会因为每个学习器只用到了一小部分训练数据,不足以进行有效的学习。因此,有必要考虑使用相互有交叠的采样子集。BaggingBagging是并行式集成学习方法最著名的代表。是基于自主采样法(bootstrap sampling)进行采样,具体步骤如下:1、在给定包含m个样本的数据集,先随机抽取一原创 2020-05-10 01:14:00 · 682 阅读 · 0 评论 -
机器学习算法之Boosting详解
提升方法(Boosting),是一种可以用来减小监督式学习中偏差的机器学习算法。它是通过训练多个弱分类器,最后加权组合成一个强分类器。弱分类器一般是指一个分类器它的分类结果仅仅比随机分类好一点点。Boosting系列算法最经典的包括AdaBoost算法和GBDT算法。 Boosting是一种递进的组合方式,每一个新的分类器都在前一个分类器的预测结果上改进,所以说boosting是减少bias而b...原创 2020-05-05 00:08:48 · 11810 阅读 · 0 评论 -
机器学习之决策树基本知识点
决策树是一种常用分类模型,优点是可读性强,分类速度快,学习时利用训练数据根据损失函数最小化的原则建立树模型。建立决策树的三个步骤:特征选择、决策树的生成、决策树的修剪(预修剪、后修剪)对于特征的选择,对于不同的算法有不同的方法,但是本质目的其实是为了降低模型的不确定性,基于其评价指标的不同,主要有ID3算法,C4.5算法和CART算法,其中ID3算法的评价指标是信息增益,C4.5算法的评价指标...原创 2020-04-23 00:41:02 · 472 阅读 · 0 评论 -
关于K-means聚类算法重点理解
介绍k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法。聚类步骤1、预将数据分为K组,则随机选取K个对象作为初始的聚类中心;2、然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。3、聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断...原创 2020-03-26 23:14:32 · 1599 阅读 · 1 评论 -
SVM算法的理解及其Python实现多分类和二分类
原理SVM被提出于1964年,在二十世纪90年代后得到快速发展并衍生出一系列改进和扩展算法,在人像识别、文本分类等模式识别(pattern recognition)问题中有得到应用。支持向量机(Support Vector Machine, SVM)是一类按监督学习(supervised learning) 方式对数据进行二元分类的广义线性分类器(generalized linear clas...原创 2020-03-15 01:22:06 · 36484 阅读 · 5 评论 -
Numpy常用函数及属性记录
一、数组常用属性Dimension transformation.reshape(shape) : 不改变当前数组,依shape生成.resize(shape) : 改变当前数组,依shape生成.swapaxes(ax1, ax2) : 将两个维度调换.flatten(): 对数组进行降维,返回折叠后的一位数组ndarray’s createnp.arange(n) : 元素从0...原创 2020-03-05 17:45:11 · 233 阅读 · 0 评论 -
BP(BackPropagation)神经网络算法详解
一、BP神经网络背景BP(back propagation)神经网络是1986年由Rumelhart和McClelland为首的科学家提出的概念,是一种按照误差逆向传播算法训练的多层前馈神经网络,是应用最广泛的神经网络。在人工神经网络的发展历史上,感知机(Multilayer Perceptron,MLP)网络曾对人工神经网络的发展发挥了极大的作用,但是,随着研究工作的深入,人们发现它还存在不...原创 2020-02-27 22:37:51 · 11900 阅读 · 0 评论