深度学习
文章平均质量分 90
介绍机器学习、深度学习以及大模型使用中涉及到的一些知识和实践技巧
YuanDaima2048
不定时更新~记录一些学习过程
展开
-
[实践应用] 深度学习之模型性能评估指标
介绍在深度学习代码实践中性能评估常用指标原创 2024-09-14 14:33:43 · 1387 阅读 · 0 评论 -
[实践应用] 深度学习之优化器
介绍在深度学习代码实践中优化器的定义原创 2024-09-14 14:33:13 · 600 阅读 · 0 评论 -
[实践应用] 深度学习之损失函数
介绍在深度学习代码实践中损失函数的定义和使用原创 2024-09-10 19:55:31 · 913 阅读 · 0 评论 -
[实践应用] 深度学习之激活函数
介绍在深度学习代码实践中激活函数的定义原创 2024-09-10 10:28:22 · 964 阅读 · 0 评论 -
卷积神经网络
卷积神经网络最初是为图像处理而设计的,但后来在文本处理、语音识别等领域也得到了广泛应用。CNN作为一种高效的图像识别方法,在模式分类领域得到了广泛应用。与全连接神经网络相比,CNN通过局部连接的方式显著减少了连接的数量,避免了对图像进行复杂的预处理,可以直接输入原始图像进行处理。这使得CNN在资源有限的硬件环境下也能够完成训练过程。原创 2024-04-03 12:01:31 · 1013 阅读 · 0 评论 -
循环神经网络算法
循环神经网络(RNN)算法通过特殊的结构使得自身具有了记忆性。可以使用记忆更好的进行判断,因此在自然语言处理、信号处理、情感识别等领域具有广泛的应用。循环神经网络是深度学习算法中非常出名的一种算法。该算法之所以被称之为循环神经网络,是因为一个序列当前的输出和前面的输出有关。具体表现为网络会对前面的信息进行记忆,并应用于当前输出的计算中。即隐藏层之间的节点不再无连接,而是有连接的,并且隐藏层的输入不仅包括输入层的输出,还包括上一时刻隐藏层的输出。理论上而言,循环神经网络能够对任何程度的序列数据进行处理。原创 2024-04-03 10:54:34 · 830 阅读 · 0 评论 -
多层感知机与DNN算法
变量是计算图中可以改变的节点,通常用来存储模型的参数,如权重和偏置。在TensorFlow中,可以使用变量来表示模型中的可训练参数,并通过梯度下降等优化方法不断调整其取值,以使模型达到最佳性能。在计算图中,张量表示数据的流动,连接了不同操作之间的输入和输出。在TensorFlow中,操作是构建计算图的基本单元,代表数据的计算过程。本文将介绍如何使用 Python 中的 TensorFlow 库来构建常见的神经网络模型,包括 DNN、CNN 和 RNN,并解释常用参数的含义。原创 2024-04-02 09:00:10 · 1142 阅读 · 0 评论 -
隐式马尔科夫算法
隐式马尔科夫算法是一种用于处理时序数据的强大工具,其特点在于能够有效地挖掘时序数据中事件之间的潜在关系。这一算法在语音识别、自然语言处理以及网络安全等领域有着广泛的应用。例如,它可以用来识别语音中的单词、理解文本中的语义,甚至是分析网络数据中的用户行为模式。隐式马尔可夫模型(Hidden Markov Model, HMM)的基本假设是一个连续的时间序列事件,其状态由它前面的一系列事件决定。这个序列可以被视为一个马尔可夫链,其中的状态是隐藏的,而观测值则是可见的。原创 2024-03-04 08:48:33 · 857 阅读 · 0 评论 -
K-Means 与 DBSCAN 算法
K-Means 算法是一种基于划分的聚类方法,其核心思想是以空间中的 k 个点为中心进行聚类。它通过迭代的方法,逐步更新各个聚类中心的值,直至得到最佳的聚类结果。DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一种具有噪声的基于密度的聚类方法。与 K-Means 不同,DBSCAN 将簇定义为密度相连的点的最大集合,能够将具有足够高密度的区域划分为簇,并且可以在噪声的空间数据库中发现任意形状的聚类。原创 2024-02-25 10:45:31 · 955 阅读 · 2 评论 -
支持向量机算法
支持向量机通过寻找一个最优的超平面来实现分类,该超平面能够将不同类别的数据点分开。在这个过程中,距离超平面最近的数据点被称为支持向量。如果数据是线性可分的,那么可以用一个超平面完美地将它们分开;但如果数据不是线性可分的,则需要使用核函数将数据映射到更高维的空间中。升维:通过将数据映射到高维空间来实现非线性变换。尽管这会增加计算复杂度,但核函数的展开定理可以巧妙地解决这个问题,使得计算复杂度并不会显著增加。原创 2024-02-25 09:48:15 · 1228 阅读 · 1 评论 -
tensorflow安装版本问题
TensorFlow有时需要额外下载低版本的cuda,为了避免在本地下载多个版本的cuda造成混乱,可以利用Anaconda,在创建的TensorFlow的虚拟环境中下载对应版本的cuda和cudnn,这样就可以成功使用gpu,也不影响别的环境。原创 2024-01-22 18:02:35 · 579 阅读 · 0 评论 -
[概念区分] 正则表达式与正则化
尽管它们都包含"正则"一词,但正则表达式和正则化是两个完全不同的概念。正则表达式用于文本处理和模式匹配,而正则化则是一种用于控制机器学习模型复杂度的技术。通过理解它们的区别和应用领域,我们可以更好地利用它们,从而更有效地处理文本和构建机器学习模型。原创 2024-02-23 14:28:28 · 616 阅读 · 0 评论 -
正则化概念及使用
这个额外的惩罚项通常与模型参数相关,迫使模型在学习过程中不仅要最小化预测误差,还要尽量减小这个惩罚项的值。为了找到最佳的模型参数,我们定义了一个损失函数(或成本函数),它度量了模型预测与真实标签之间的差异。然而,当模型过于复杂时,它可能会过度拟合训练数据,即在训练数据上表现很好,但在未见过的数据上表现不佳。通过了解正则化的原理和常用方法,我们可以更好地构建具有良好泛化能力的机器学习模型,从而在实际问题中取得更好的效果。值导致了更大的正则化惩罚,因此模型更倾向于选择较小的参数值,以减少过拟合的风险。原创 2024-02-23 14:26:38 · 630 阅读 · 0 评论 -
逻辑回归算法概述
概述如何调用库函数选择适当的优化算法优化算法的作用逻辑回归 LogisticRegression 中优化算法的选择机器学习实战工具安装和使用逻辑回归是一种用于估计某种事物可能性的算法,可用于回归和分类任务。它通过历史数据的表现来预测未来结果的概率。回归分析描述自变量 ( x ) 和因变量 ( y ) 之间的关系,或者自变量 ( x ) 对因变量 ( y ) 的影响程度,并对因变量 ( y ) 进行预测。因变量是我们希望获得的结果,而自变量是影响结果的潜在因素。自变量可以是单个变量,也可以是多个变量。原创 2024-02-22 15:17:15 · 2192 阅读 · 0 评论 -
朴素贝叶斯算法
在实际应用中,朴素贝叶斯算法在垃圾邮件过滤中表现出色。它不仅准确率高,而且速度快,且对于处理大规模数据集时也能够保持良好的性能。同时,朴素贝叶斯算法对于缺失数据不太敏感,这在实际场景中也是非常有用的特性。综上所述,这三种朴素贝叶斯模型在运算速度复杂度和计算概率的方式上都有所不同,选择合适的模型应根据数据的特点和计算资源的限制来进行。朴素贝叶斯(NB)是一种基于贝叶斯定理与特征条件独立假设的分类算法。朴素贝叶斯算法简单易懂,其核心思想是假设在给定目标值时,各个属性之间相互独立。原创 2024-02-19 09:17:35 · 1224 阅读 · 0 评论 -
决策树与随机森林算法
随机森林是由多棵决策树组成的集成模型,每棵决策树都是相对独立的。随机森林利用了决策树的基本思想,但通过引入随机性和集成学习的方法,进一步提升了模型的性能和稳定性。# 创建随机森林分类器随机森林是一种集成学习方法,它由多个决策树构成的分类器组成。每个决策树都是独立训练的,且它们之间相互独立,没有关联。在随机森林中,每棵决策树的训练数据是通过有放回抽样(bootstrap抽样)得到的,这意味着每棵树的训练数据集都是从原始数据集中随机抽取的,可能包含重复的样本,同时也可能有未被抽取的样本。原创 2024-02-10 22:01:12 · 2806 阅读 · 4 评论 -
K 近邻算法
尽管它们的计算方法和效率不同,但它们都遵循了KNN的基本原理,即通过测量样本点之间的距离来找到最近的邻居。在实际应用中,选择合适的算法通常取决于数据集的特征,以及对性能和内存的要求。这些K最近邻算法的本质都是基于计算样本点之间的距离,然后找到最近的邻居。K近邻算法(KNN):KNN表示K个最近的邻居的意思,即每个样本都可以用它最接近的K个邻居来代表。使用树形结构,通过在每个节点上选择一个维度进行划分,减少了距离计算的次数,适用于低维数据集。最简单直接的方法,计算每个点与所有其他点的距离,因此复杂度较高。原创 2024-02-05 17:59:48 · 811 阅读 · 1 评论