机器学习
文章平均质量分 88
IAz-
这个作者很懒,什么都没留下…
展开
-
[ML]机器学习_强化学习
强化学习是一种从环境与智能体的交互中进行学习的机器学习方法。它的主要目标是通过智能体进行实验来获得关于环境和任务的信息,最终达到最优的决策策略。 在强化学习中,人们通常将环境描述为一系列状态和动作的集合。智能体的任务是选择一系列动作来改变环境的状态,并最大化长期的回报(通常用累计奖励的期望来表示)。智能体的决策策略通常基于学习算法得出并随时间推进而发生调整。 在强化学习中,有两种基本的方法:基于值函数的方法和基于策略的方法。 基于值函数的方法,比如Q-learning,通过学习环原创 2023-12-08 10:48:14 · 329 阅读 · 0 评论 -
[ML]机器学习_PCA主成分分析
主成分分析(PCA)是一种算法,可以获取大量特征的数据,并将特征数量减少到两三个特征(即二维或三维),以便对特征进行可视化绘图。如果有关于轿车集合的数据,轿车有许多的特征,如汽车长度,宽度,高度等。借助PCA减少特征数量以便将其特征可视化。1、假设特征是汽车的长度,是汽车的宽度,由于事实情况限制,汽车的宽度往往变化不会太大,如果有一个汽车集合中是汽车长度和宽度的数据集,则数据特征分布会如下图所示。其中特征车长变化很大,而特征车宽则变化相对较小。如果需要减少特征,则可以做的是取特征车长。原创 2023-12-07 17:31:12 · 902 阅读 · 0 评论 -
[ML]机器学习_基于内容过滤的深度学习算法
基于内容过滤的深度学习算法是一种利用深度学习技术实现的推荐算法。它的主要思想是利用用户过去的行为和偏好以及物品的内容特征,通过深度学习模型来预测用户对物品的兴趣度,并向用户推荐可能感兴趣的物品。具体来说,基于内容过滤的深度学习算法一般分为以下几个步骤:特征提取:首先需要对物品的内容进行特征提取。这一步通常是使用卷积神经网络(CNN)或循环神经网络(RNN)等深度学习模型提取物品的视觉、文本、音频或其他内容特征。特征表示:将提取出的物品特征表示为向量形式。原创 2023-12-05 20:35:50 · 914 阅读 · 0 评论 -
[ML]机器学习_协同过滤算法
协同过滤算法是一种推荐算法,其目的是为用户推荐他们可能感兴趣的物品。该算法使用用户的历史行为和偏好来预测他们对尚未查看或评分的物品的偏好。协同过滤算法有两种类型:基于用户和基于物品。基于用户的协同过滤算法根据用户之间的相似度来推荐物品。它首先计算用户之间的相似度,并根据这些相似度为每个用户推荐适合他们的物品。基于物品的协同过滤算法是相反的,它根据物品之间的相似度来推荐物品。协同过滤算法分为两种主要类型:基于用户的协同过滤和基于物品的协同过滤。原创 2023-11-26 19:28:12 · 965 阅读 · 0 评论 -
[ML]机器学习_异常检测算法
异常检测是指在大量数据中检测出与其他数据不同的数据点或样本,通常被称为“异常值”或“离群值”。异常值可能是因为数据记录错误,或者是由于真实世界中的异常事件或问题导致的。异常检测是数据挖掘领域中的重要任务之一,它可以应用在许多领域,例如金融、医疗、电力、交通等。在金融领域,异常检测可以用来检测信用卡欺诈、洗钱等;在医疗领域,异常检测可以用来识别病人的异常病情,以及早期预警疾病的发生等。异常检测算法会查看未标记的正常数据集,从而学会检测异常事件或发出危险信号。原创 2023-11-06 21:04:17 · 43 阅读 · 0 评论 -
[ML]机器学习_聚类算法
聚类是一种机器学习和数据挖掘技术,它是将数据集中的数据对象分成不同的组或类的过程。它的目的是识别出数据集中相似的数据对象,并将它们分组。聚类算法通常基于两个基本假设:相似性和连续性。相似性假设认为属于同一组的数据对象应该具有相似的属性值。连续性假设认为属于同一组的数据对象应该彼此接近。聚类算法可以用于各种不同的领域,例如数据挖掘、生物学、图像处理和市场营销。聚类的结果可以用于确定数据集中的模式和结构,以及发现数据集中的异常值和离群点。原创 2023-11-05 10:07:13 · 341 阅读 · 0 评论 -
[ML]机器学习_决策树模型
决策树是一种经典的监督学习模型,它通过对数据集进行递归分区,最终形成一个树形结构,树上每个节点都对应一个关于特征的判断条件,而叶节点则是对应一个分类结果或者回归值。决策树可以用于分类(C4.5、CART)和回归(CART),其中分类树解决离散变量,回归树解决连续变量。决策树的构建过程一般包括以下几个步骤:特征选择:选择最优的特征作为当前节点的分裂依据,这一步通常根据信息熵或者基尼不纯度进行计算。原创 2023-10-28 17:15:28 · 84 阅读 · 0 评论 -
[ML]机器学习_机器学习开发流程
首先,决定系统的总体架构,然后根据架构实现模型和训练模型,之后是诊断模型,根据诊断的结论更新模型架构,然后使用新的总体架构再次进行循环迭代,直到模型达到预期的性能要求。原创 2023-10-23 21:09:59 · 46 阅读 · 0 评论 -
[ML]机器学习_模型评估
如果我们运行模型时,发现这个模型预测的结果不准,则通常有如下对策:1、获得更多训练示例2、减少那些影响较小的特征3、使用特征工程添加特征4、减小或者增大正则化项中的通过模型评估可以得到一些诊断,能够得知,是否值得花费数周甚至数月时间收集更多训练数据来提高性能。原创 2023-10-21 10:06:46 · 46 阅读 · 0 评论 -
[ML]机器学习_高级优化算法
梯度下降算法是一种常用的优化算法,可以用来求解一些最小化误差函数的问题。在机器学习领域,梯度下降算法通常用来最小化损失函数,从而得到一个最优的模型参数。下面详细介绍梯度下降算法的原理和实现。梯度下降算法是机器学习中最常用的优化算法之一,可以用来最小化损失函数,得到最优的模型参数。批量梯度下降、随机梯度下降和小批量梯度下降是梯度下降算法的三种不同变体,适用于不同的训练数据集大小和模型复杂度。在实现时,需要注意学习率的选择、收敛条件的判断以及参数的初始化等问题,以保证梯度下降算法能够正确地收敛。原创 2023-10-19 10:34:11 · 82 阅读 · 0 评论 -
[ML]机器学习_多分类问题
softmax回归的主要目标是学习一个线性模型,在该模型的基础上使用softmax函数将线性输出转换为概率分布。具体来说,softmax函数将每个类别的线性得分转化为概率分布,使得所有的概率值都为正且加起来等于1。在机器学习中,通常使用监督学习算法进行多分类问题的解决,其中输入数据包括特征和标签,标签是由多个类别中的一种或多种组成的。softmax回归,也称为多项逻辑回归,是一种用于多分类问题的监督学习算法。该算法输出每个类别的概率,最终选择概率最高的类别作为预测结果。二、Softmax回归算法。原创 2023-10-16 20:29:43 · 156 阅读 · 0 评论 -
[ML]机器学习_激活函数
激活函数(Activation Function)是神经网络中的一种数学函数,用于将输入转换为输出,并增加神经元之间的非线性特性。激活函数通常被应用于神经网络中的隐藏层和输出层,以实现非线性映射和复杂的分类和回归任务。常见的激活函数包括Sigmoid函数、ReLU函数、Tanh函数等。选择合适的激活函数可以对神经网络的性能和准确度产生重要影响。原创 2023-10-16 17:14:04 · 21 阅读 · 0 评论 -
[ML]机器学习_神经网络训练
有一个输入x,然后第一个隐藏层有25个单元,第二个隐藏层有15个单元,然后是一个输出单元。第一步让TensorFlow按顺序将神经网络的三层串联起来。第二步是让TensorFlow编译模型,要求编译模型的关键步骤是指定要使用的损失(Loss)函数,在示例中,使用二元交叉熵损失函数。第三步是调用fit函数,它使用在步骤二中指定的损失函数来拟合第一步中指定的模型到数据集x,y。在TensorFlow中,fit()函数是用于训练模型的主要函数之一。它的作用是训练一个模型,使其能够对未知的数据进行预测。原创 2023-10-16 17:03:38 · 25 阅读 · 0 评论 -
[ML]机器学习_强人工智能
强人工智能(Artificial general intelligence)是指拥有与人类智能相当甚至超越人类智能的人工智能。它不仅可以像现代人工智能一样完成任务,而且还可以像人类一样思考、推理、学习、理解自然语言、甚至拥有情感等高级智能能力。强人工智能的研究至今仍处于起步阶段,但如今已经涉及到许多领域,如机器学习、自然语言处理、人机交互、计算机视觉等。尽管强人工智能的发展还面临着许多技术和道德难题,但其应用前景广阔,未来将在社会、经济、政治等方面发挥重要作用。原创 2023-10-15 15:56:27 · 72 阅读 · 0 评论 -
[ML]机器学习_如何用代码实现
TensorFlow是由Google推出的开源机器学习框架,被广泛应用于深度学习、神经网络等领域。它可以在各种硬件设备上运行,包括CPU、GPU和TPU等,使得用户可以在不同的硬件上进行机器学习的计算。数据流图(Data Flow Graph):TensorFlow采用数据流图模型来表示计算图,节点表示操作,边表示数据。这种模型可以并行计算,使得TensorFlow在大规模数据处理时能够高效地运行。原创 2023-10-14 20:08:52 · 56 阅读 · 0 评论 -
[ML]机器学习_神经网络
人工神经网络(Artificial Neural Networks,简写为ANNs)是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的,并具有自学习和自适应的能力。神经网络类型众多,其中最为重要的是多层感知机。为了详细地描述神经网络,我们先从最简单的神经网络说起。神经网络最初的动机是试图建立模拟大脑的软件。模拟大脑神经元之间通过电脉冲通信的流程。原创 2023-10-06 16:57:22 · 28 阅读 · 0 评论 -
[ML]机器学习_基础
指学习x到y或输入到输出映射的算法。关键在于提供学习算法示例和正确答案。对于给定的输入x,正确的标签y可通过正确的学习算法来确定,最终通过对输入x和期望输出标签y的学习,可以得出合理且准确的预测或猜测。因此,在学习过程中,必须同时考虑输入和输出标签,才能有效地优化算法。是没有标签数据的情况下,从输入数据中学习到数据的结构和特性。数据仅带有输入x而没有输出标签y,并且算法必须发现在数据中的某些结构或者模式。原创 2023-09-30 16:04:05 · 20 阅读 · 0 评论 -
[ML]机器学习_线性回归模型
线性回归模型是用于建立变量之间线性关系的一种经典的机器学习模型。它假设因变量(输出变量)和自变量(输入变量)之间存在线性关系,并用一条直线(或超平面)来近似表达这种关系。线性回归模型的目标是根据给定的自变量的值预测因变量的值。模型可以用简单线性回归或多元线性回归等形式表示,其中简单线性回归只包含一个自变量,多元线性回归包含多个自变量。在模型训练过程中,通过最小化残差来优化模型,使模型能够最好地拟合实际数据。线性回归模型广泛应用于生物医学、金融、工业、社会科学等领域。原创 2023-09-30 17:20:54 · 26 阅读 · 0 评论 -
[ML]机器学习_多元线性回归
多元线性回归指的就是一个样本有多个特征的线性回归问题。VectorVectornotes:n为特征的数量点积(dot product)原创 2023-10-02 18:43:30 · 29 阅读 · 0 评论 -
[ML]机器学习_逻辑回归算法
输出变量只能取少数可能值中的一个,而不是无线数字范围内的任何数字。也指得到的输出变量的值是的而并非连续的。原创 2023-10-03 20:16:42 · 35 阅读 · 0 评论 -
[ML]机器学习_过拟合与正则化
也称为高方差(High variance),具体表现为模型在测试数据上泛化不佳。过拟合其实就是为了得到一致假设而使得假设过于地严格,使得其在训练集上的表现非常地完美,但是在训练集以外的数据集却表现不好。,也称为高偏差(High bias)是指模型在训练数据和测试数据上都表现较差的现象。欠拟合的模型过于简单,以至于它无法捕捉到数据中的关键特征和模式。原创 2023-10-05 17:19:36 · 32 阅读 · 0 评论