luyouqi11-CSDN博客

原创机器学习(25) 聚类Clustering之二：直观感受K-means算法

从一个2维的样本集开始，该实现可以帮助读者对k-means算法有一个直观的感受。然后将使用k-means算法对图像进行压缩，通过减少颜色数量，直到只出现在该图像中最常见的那些颜色。

2023-11-02 12:12:18 189

原创机器学习(24) 聚类Clustering之一：无监督学习

根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题，称之为无监督学习，“监督”的意思可以直观理解为“是否有标注的数据”。无监督学习的特点是，传递给算法的数据在内部结构中非常丰富，而用于训练的目标和奖励非常稀少。无监督学习算法学到的大部分内容必须包括理解数据本身，而不是将这种理解应用于特定任务。聚类是无监督学习的常见任务，就是将观察值聚成一个一个的组，每一个组都含有一个或者几个特征，‎聚类的目的在于‎‎把相似的东西聚在一起，而我们并不关心这一类是什么‎‎。

2023-11-02 11:25:48 276

原创机器学习(23) SVM 示例4:【Python】解决二分类(示例1、2、3)

z = svc.predict(np.c_[x.flatten(),y.flatten()])#因为predict中是要输入一个二维的数据，因此需要展开。z = svc.predict(np.c_[x.flatten(),y.flatten()])#因为predict中是要输入一个二维的数据，因此需要展开。print(f'预测样本数据X的对数概率 svc.predict_log_proba(X) ={svc1.predict_log_proba(X)}'),10的0次幂,10,1000,10000。

2023-08-08 19:44:24 1391

原创机器学习(22) SVM 示例3:【Octave】解决二分类(非线性SVM[边界不清晰])

这里C和σ都采用公比为3的等比数列进行逐次验证，每次根据这两个对应的值去训练得到参数theta，然后得到交叉验证集的准确率，通过比较这次与上次的准确率，选用准确率更高的参数值。%% ==================== Part 2: 非线性SVM训练 ====================%% =============== Part 1: 加载并可视化数据 ================%% =============== Part 1: 加载并可视化数据 ================

2023-08-08 19:28:34 224

原创机器学习(21) SVM 示例2:【Octave】解决二分类(非线性SVM[边界清晰])

% ==================== Part 2: 线性SVM训练 ====================%% =============== Part 1: 加载并可视化数据 ================%% =============== Part 1: 加载并可视化数据 ================% y 训练集输出特征向量，是一个包含1和0的列向量，行数为样本数，列数为1。% 输出： pred 是一个行数为样本数，列数为1的{0,1}值的预测列向量。

2023-08-08 19:13:57 153

原创机器学习(20) SVM 示例1:【Octave】解决二分类(线性SVM)

plotData(X, y)绘制数据，% 输入参数： X 输入特性矩阵，行数为样本数，列数为2，每一行是一个二维点% y 输出特性向量，行数为样本数，列数为1，每个元素值为0或1.% 输出结果：样本的输出特性向量为1的打上‘+’标记，为0的打上‘o'标记figure;hold on;hold off;

2023-08-08 19:05:55 374

原创机器学习(19) SVM 支持向量机

是：和是n维欧氏空间中的两个点集。如果存在n维向量和实数b。

2023-08-08 18:42:47 147

原创机器学习(18) 训练集、测试集及模型效果评估

一般先绘制训练集、验证集的误差曲线。以训练集的学习曲线为例，以训练集样本的数目m为横坐标，以平均误差平方和为纵坐标绘制曲线，观察训练误差随训练样本集大小变化之间的关系。如果我们有100个样例的训练集，我们会刻意改变训练集的大小m（比如，m=10,20,30,...,100)，当m变化时训练集的平均误差平方和也会跟着变化，这样就可以观察我们的算法随着训练集大小的变化其在训练集上的平均误差平方和方面的表现。

2023-08-08 17:29:35 2409

原创机器学习(17) 实例：利用神经网络对图片中手写数字 0-9 进行识别

实现反向传播 backpropagation神经网络算法，对图片中手写数字 0-9 进行识别手写数字图片数据。每张图片20px * 20px，也就是一共400个特征。

2023-08-04 11:20:20 724

原创机器学习(16) 神经网络模型进阶

利用神经网络训练数据，最重要的首先是确定神经网络的结构。

2023-08-04 10:54:42 54

原创机器学习(15) 神经网络：常见的神经网络架构

用神经网络表示如下：可以说，神经网络就是由一个个逻辑回归模型连接而成的，它们彼此作为输入和输出。输出结果可表示为：训练集为：当时，表示识别的是行人当时，表示识别的是汽车当时，表示识别的是摩托车当时，表示识别的是卡车用0与1的组合成的向量代替1，2，3，4：

2023-08-04 10:14:04 89

原创机器学习(14) 运用神经元解决同或(XNOR)、异或(XNOR)分类问题

就像单层神经元（无隐藏层）无法表示逻辑。

2023-08-04 10:07:17 1878

原创机器学习(13) 神经网络：简介

h。

2023-08-04 09:42:55 114

原创机器学习(12) 线性回归、逻辑回归的正则化算法

对于线性回归(的求解)，我们之前运用了两种学习算法，一种基于梯度下降，一种基于正规方程。

2023-08-04 08:38:36 187

原创机器学习(11) 正则化(Regularization)

我们把此类情况称为欠拟合(underfitting)，或者叫作叫做高偏差(bias)。所以，我们把这类情况叫做过拟合(overfitting)，也叫高方差(variance)。与高偏差一样，高方差同样也是一个历史上的叫法。从第一印象上来说，如果我们拟合一个高阶多项式，那么这个函数能很好的拟合训练集（能拟合几乎所有的训练数据），但这也就面临函数可能太过庞大的问题，变量太多。过度拟合的问题通常发生在变量（特征）过多的时候。

2023-08-03 16:44:20 71

原创机器学习(10) 逻辑回归：多元分类(Multi-class classification)

对于数据集中存在多个类别的分类问题，我们可以采用一种叫做 One-vs-rest 的方法，将其转化成二元分类的问题，然后再进行解决。前面的是对于二元分类问题，应该如何去处理其预测函数、代价函数和梯度下降算法。但是多元的分类才是生活常见的情况。例如对于邮件，我们可以分为工作、朋友、家人、兴趣；例如对于天气，我们可以分为晴朗、多云、下雨、有雪。对于这样的多元分类，应该如何处理呢？分类情况其实很简单，把多元分类划分为多个二元分类就可以了：这样我们就能将多元分类问题当成二元分类问题进行解决。

2023-08-03 12:44:10 1710

原创机器学习(9) 逻辑回归示例：实现非线性逻辑回归

answer['F{}{}'.format(i-j,j)]=np.power(x1,i-j)*np.power(x2,j) #形成字典中的key-value。theta=gradientDescent(mappingX,y,theta,alpha,iterations,X.shape[0],lamda) #进行正则化的梯度下降。answer.insert(0,"ones",np.ones((answer.shape[0],1))) #插入第一列全1。

2023-08-03 11:29:00 48

原创机器学习(8) 逻辑回归示例：实现线性逻辑回归

temp0=theta[0][0]-alpha*(ys*(X[:,0].reshape(X.shape[0],1))).sum() #注意这里一定要将X[:,1]reshape成向量。输入测试样例以已经本文最前面贴出分别有两组数据。print('accuary:',(yanswer<0.5).sum()/y.shape[0]*100,'%') #计算准确率并打印结果。yy=(theta[0][0]+theta[1][0]*xx)/(-theta[2][0]) #绘制决策边界。

2023-08-03 11:22:05 78

原创机器学习(7) 逻辑回归：二分类

由线性回归的代价函数：若我们定义：则有：称为逻辑回归的单样本代价函数称为逻辑回归的代价函数，我们将代入代价函数，则有：该函数是个非凸函数，这会导致在梯度下降时没有全局最优解。于是我们必须另外选择一个代价函数。如：这个函数看起来很复杂，但画出图形如下：通过上面图形，我们知道：预测：如果,预测y=1，此时Cost=0。(正常预测)如果,预测y=1，此时Cost=0.8。(正常预测)如果,预测y=1，此时Cost→∞。(极不正常预测)反之：如果。

2023-08-03 10:16:44 104

原创机器学习(6) 逻辑回归：概要

虽然我们人类都不喜欢被分类，被贴标签，但数据研究的基础正是给数据“贴标签”进行分类。类别分得越精准，我们得到的结果就越有价值。分类是一个有监督的学习过程，目标数据库中有哪些类别是已知的，分类过程需要做的就是把每一条记录归到对应的类别之中。由于必须事先知道各个类别的信息，并且所有待分类的数据条目都默认有对应的类别，因此分类算法也有其局限性，当上述条件无法满足时，我们就需要尝试聚类分析。

2023-08-03 09:15:23 29

原创机器学习(5) 多元线性回归

假设样本个数为m，具体为。

2023-08-02 20:05:37 156

原创机器学习(4) 梯度下降Gradient descent

在微积分里面，对多元函数的参数求∂偏导数，把求得的各个参数的偏导数以向量的形式写出来，就是梯度。比如函数f(x,y), 分别对x,y求偏导数，求得的梯度向量就是,简称或者∇fxy)。对于在点的具体梯度向量就是.或者，如果是3个参数的向量梯度，就是以此类推。

2023-08-02 19:12:35 208

原创机器学习(3) 一元线性回归（最小二乘法实现）

一元线性回归是分析只有一个和线性相关关系的方法。一个经济指标的数值往往受许多因素影响，若其中只有一个因素是主要的，起决定性作用，则可用一元线性回归进行预测分析。，是根据和的相关关系，由于市场现象一般是受多种因素的影响，而并不是仅仅受一个因素的影响。所以应用一元线性回归分析预测法，必须对影响市场现象的多种因素做全面分析。只有当诸多的影响因素中，确实存在一个对因变量影响作用明显高于其他因素的变量，才能将它作为自变量，应用一元相关回归分析市场预测法进行预测。

2023-08-02 17:52:24 347

原创机器学习(2) 机器学习中的俗语

对于给定的训练集，假设函数为。称为假设函数h的代价函数。对于一元线性回归，其代价函数为。

2023-08-02 16:20:39 28

原创机器学习(1) 简介

机器学习是一种通过利用数据，训练出模型，然后使用模型预测的一种方法。机器学习与模式识别、统计学习、数据挖掘、计算机视觉、语音识别、自然语言处理等领域有着非常深的联系。任务T经验E性能P机器学习 = 通过经验E的改进后，机器在任务T上的性能p所度量的性能有所改进= T–>(从E中学习)–>P（提高）

2023-08-01 19:32:06 48

原创 opencv(56) 案例：银行卡号识别

python imutils包可以很简洁的调用opencv接口，轻松实现图像的平移，旋转，缩放，骨架化等操作。可以使用下列命令安装imutils包。

2023-08-01 19:03:19 231

原创 opencv(55) 深度神经网络：dnn模块

OpenCV自3.3版本开始，加入了对深度学习网络的支持，即DNN模块，它支持主流的深度学习框架生成与到处模型的加载。DNN模块的架构如下图所示：从上往下依次是：除了上述的加速方法外，DNN模块还有网络层面的优化。这种优化优化分两类，一类是层融合，还有一类是内存复用。层融合通过对网络结构的分析，把多个层合并到一起，从而降低网络复杂度和减少运算量。如上图所示，卷积层后面的BatchNorm层、Scale层和RelU层都被合并到了卷积层当中。这样一来，四个层运算最终变成了一个层运算。如上图所示，网络结构将卷积层

2023-07-27 09:03:50 787

空空如也

空空如也