游游游55544-CSDN博客

原创深度学习(2)-循环神经网络

前馈神经网络中，把每个神经元按接收信息的先后分为不同的组，每一组可以看做是一个神经层。每一层中的神经元接收前一层神经元的输出，并输出到下一层神经元。整个网络中的信息是朝着一个方向传播的，没有反向的信息传播（和误差反向传播不是一回事），可以用一个有向无环图来表示。前馈神经网络包括全连接前馈神经网络和卷积神经网络。前馈神经网络可以看做是一个函数，通过简单非线性函数的多次复合，实现输入空间到输出空间的复杂映射。

2024-08-21 23:52:42 1086

原创深度学习(1)-卷积神经网络初步

卷积神经网络（Convolutional Neural Network，CNN）是一种非常典型的网络架构，常用于图像分类等任务。所谓图像分类，就是给机器一张图像，由机器去判断这张图像的内容。卷积神经网络的设计灵感来自于生物学中的视觉系统，旨在模拟人类视觉处理的方式，已经在图像识别、目标检测、图像生成和许多其他领域取得了显著的进展，成为了计算机视觉和深度学习研究的重要组成部分。

2024-08-16 10:58:24 646

原创机器学习(10.1)-k近邻学习

k近邻(k-Nearest Neighbor，kNN)学习是一种常见的监督学习方法，可用于分类和回归任务。其工作机制为：给定测试样本，基于某种距离度量找出训练集中与其最靠近的k个训练样本，然后基于这k个“邻居”的信息来进行预测。在分类任务中可使用“投票法”，即选择这k个实例中出现最多的标记类别作为预测结果；在回归任务中可使用“平均法”，即将这k个实例的实值输出标记的平均值作为预测结果；还可基于距离远近进行加权平均或加权投票，距离越近的实例权重越大。

2024-08-08 14:35:18 917

原创机器学习(12)-集成学习

集成学习(Ensemble Learning)，归属于机器学习，是一种“训练思路”，并不是某种具体的方法或者算法。集成学习通过构建并结合多个学习器来完成学习任务，其核心思路就是“人多力量大”，其并没有创造出新的算法，而是把已有的算法进行结合，从而得到更好的效果。集成学习的一般结构为：先产生一组“个体学习器”，再用某种策略将它们结合起来。集成中只包含同种类型的个体学习器，称为同质，当中的个体学习器亦称为“基学习器”，相应的算法称为“基学习算法”。

2024-08-03 13:57:00 879

原创机器学习(11)-贝叶斯分类

贝叶斯分类是一类分类算法的总称，这类算法均以贝叶斯定理为基础，故统称为贝叶斯分类。其中朴素贝叶斯分类是贝叶斯分类中最简单最常见的一种分类方法。朴素贝叶斯不能用于回归，但是是一个有效的分类器。

2024-07-29 21:43:44 735

原创机器学习(10)-决策树

决策树(Decision Tree)，是一种以树形数据结构来展示决策规则和分类结果的模型。决策树通过一系列的决策节点，将数据分类到不同的类别中，或者预测一个连续的数值。决策树模仿了人类的决策过程，通过树形结构进行决策，其中每个内部节点代表一个特征属性上的判断，每个分支代表判断的结果，而每个叶节点则代表最终的决策结果。

2024-07-28 22:15:37 931

原创机器学习(9)-异常检测

异常检测，是指在给点数据集中识别出与正常数据不同的数据和与预期行为差异大的数据。异常检测问题通常被归类为非监督学习问题，却具有与监督学习相似的特征。在异常检测中，通常处理的是未标记的数据，即没有明确的标签指示哪些样本是异常的，因此算法需要根据数据本身的特征来确定异常。

2024-07-26 15:32:35 674

原创机器学习(8)-降维

鸢尾花(Iris)数据集包含150个样本，每个样本有4个特征，使用PCA将原始4维数据降维到2维，在降维后的二维空间中，每个数据点用一个散点表示，不同类别(Setosa、Versicolor、Virginica)用不同的颜色表示，分别是红色(r)、绿色(g)和蓝色(b)。降维有助于减少计算复杂度和存储需求，缓解高维数据带来的维度灾难，消除冗余和噪声特征，改善模型性能并减少过拟合。降维也是一种无监督学习问题，指采用某种映射方法，将原高维空间中的数据点映射到低维度的空间中。计算协方差矩阵的特征值和特征向量。

2024-07-23 20:36:38 749

原创机器学习(7)-聚类

聚类(Clustering)是最常见的无监督学习算法，指的是按照某个特定标准（如距离）把一个数据集分割成不同的类或簇，使得同一个簇内的数据对象的相似性尽可能大，同时不在同一个簇中的数据对象的差异性也尽可能地大。也即聚类后同一类的数据尽可能聚集到一起，不同类数据尽量分离。聚类是一种无监督学习，而分类是一种有监督的学习。聚类只需要人工指定相似度的标准和类别数，而分类需要从训练集学习分类的方法。

2024-07-21 23:10:16 937

原创机器学习(6)-支持向量机(SVM)

支持向量机的目标是找到一个函数，使得大部分数据点都落在间隔内，并且使得落在间隔之外的数据点的预测误差最小化。这些落在间隔之外的数据点被称为支持向量。对于一些数据集，不存在一个能够正确划分两个类别样本的超平面，对这样的问题，可以将样本从原始空间映射到一个更高维的特征空间中，使得样本在这个特征空间中线性可分。将原始空间中的向量作为输入向量，并返回特征空间（转换后的数据空间,可能是高维）中向量的点积的函数称为核函数。在预测时，我们采用的特征不是训练实例本身的特征，而是通过核函数计算出的新特征f1,f2,f3。

2024-07-19 16:20:25 707

原创机器学习(5)-神经网络

此前的线性回归和逻辑回归，在特征数量较多时将面临计算负荷过大的问题。人工神经网络（Artificial Neural Network，ANN），简称神经网络（Neural Network，缩写NN）或类神经网络，是一种模仿生物神经网络的结构和功能的数学模型或计算模型，用于对函数进行估计或近似。输入层隐藏层输出层构成，如下图。输入层接受并规范化数据，将其传递给神经网络。隐藏层通过加权和激活函数提取特征，执行复杂计算。输出层生成最终结果，提供预测或分类。

2024-07-18 10:07:48 627

原创机器学习(4)-逻辑回归

对于二分类问题，由于分成两类，需要让其中一类标签为0，另一类为1。而且函数中需要待定参数，通过利用样本训练，使得这个参数能够对训练集中的数据有很准确的预测。在分类问题中，需要预测的变量y是离散的值，通常，尝试预测结果是否属于某一个类别属性。使用梯度下降法，和单变量线性回归问题中的目标一样，要找出使得代价函数最小的一系列参数。表示y=2，叉叉表示y=3，下面要做的就是使用一个训练集，将其分成 3 个二元分。假设有一个训练集，如上图表示的有 3 个类别，我们用三角形表示y=1，方框。

2024-07-15 20:25:51 360

原创机器学习(3)-多变量线性回归&多项式回归

梯度下降算法的每次迭代受到学习率的影响，如果学习率α过小，则达到收敛所需的迭代次数会非常高；对没有进行特征缩放的训练集使用梯度下降法训练时，会导致迭代次数增加的情况。使用梯度下降法时，特征缩放有助于减少迭代次数，提升模型训练速度，使模型更快地收敛。在此前的单变量线性回归的基础之上增加更多的特征，构成一个多变量的回归模型，模型中的特征为(x1,x2,x3,...,xn)特征缩放：将不同特征的值量化到同一区间的方法，将原本由于单位不同而导致数值范围上存在较大差异的特征放到同一个数值区间内。

2024-07-13 23:05:23 866

原创机器学习-单变量线性回归问题

以线性回归算法为例，对于输入的一组数据训练集（x，y），训练出模型，预测输入x对应的输出值h(x)。我们选择的参数𝜃0和𝜃1，决定了我们得到的直线相对于训练集的准确程度，模型所预测的值与训练集中实际值之间的差距就是建模误差。训练集一共m个数据，计算每个数据的预测输出和实际输出的误差的平方，求和后再除以m，再除以2，表达式如下。对于回归问题，一种可能的回归表达式为ℎ𝜃 (𝑥) = 𝜃0 + 𝜃1𝑥，只含有一个特征/输入变量，因此这样的问题叫作单变量线性回归问题。需要根据已知数据来预测一个准确的输出值。

2024-07-13 11:30:31 226

原创数据结构与算法课程设计-霍夫曼编码/译码器

初期构建基本程序框架时比较顺利，然而在编程过程中遇到的问题接踵而至，如怎样在类之间实现数据共享，怎样在图形化界面中绘制赫夫曼树的图形等等，对于在类之间实现数据共享，我首先想到的是全局变量或者静态变量，友元函数等方法，最后想到面向对象编程的思想，能否将要共享的数据抽象为一个类呢？在DataShare类中，使用map 的map键值对，来保存字符与其对应的赫夫曼编码的一一对应关系，使用vector的容器来保存赫夫曼树的结点。匹配失败则不做操作。

2024-07-13 11:04:18 1016

原创机器学习-最最基本概念

机器学习是一门从数据中研究算法的科学学科，尝试让计算机模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。基于已知类别标签的样本构成的训练集，建立预测模型，对新的观测样本，预测相应的输出。基于已知答案的样本构成的训练集，建立起估计自变量与因变量之间关系的模型，基于该模型对新的观测样本的输出进行预测，预测输出为连续值。提供输入数据和其对应的标签数据，搭建一个模型，模型经过训练后准确的找到输入数据和标签数据之间的最优映射关系，从而对新的未标记数据进行预测或分类。

2024-07-13 10:48:18 332

qq_45378317的博客