yaoyao在發光-CSDN博客

原创【耗时八个小时】机器学习过拟合和欠拟合！看这一篇文章就够了

今天介绍了过拟合和欠拟合，以及代码案例，并且给出的解决方案。喜欢的朋友可以起来！

2024-06-25 09:18:17 832

原创程序员最趁手的SVM算法，学完你会哭着感谢努力的自己！

另外，非线性SVM的数学公式比较复杂，但我们可以简化为：它是一种方法，可以将数据映射到一个不同的空间，然后在那个空间中使用线性SVM。我们还有k个类别，用1到k的数字表示。它的目标是找到一个能够在数据中画出一条直线（或者高维空间中的超平面），将不同类别的数据点分隔开，并且最大化两侧最靠近这条线的数据点之间的距离。：SVM支持向量机对于训练数据中的噪声和异常点具有一定的鲁棒性，可以有效地处理输入数据中的噪声。核贝叶斯支持向量机通过学习一些已知的例子，并找到一个特殊的边界，用于将不同的事物区分开来。

2024-06-25 09:17:46 1186

原创 ❤【纯干货】Matplotlib总结，任何项目都用得到呦❤

在很多人眼里是无敌的存在，而且可以说是无敌的存在。走过数据科学的路，路上必然有的风景在你周围。如果同一个项目，你的用了matplotlib 不仅有基本图形、定制化图形、多个坐标轴、3D绘图，还有动态交互绘图、绘制地图、绘制统计图表，甚至还有地图分布！那么谁的更吸引人呢？收藏备用，一定用的上！是一个功能强大且广泛使用的数据可视化工具，特别适用于科学计算、数据分析和数据科学领域。下面是关于 Matplotlib 的一些主要特点和组成部分的介绍：1、图表类型：包括折线图、散点图、柱状图、饼图、等高线图、热图、直

2024-06-24 14:34:42 546

原创 ❤机器学习正则化算法的总结。耗时10个小时完成。❤

Dropout 正则化的原理是，在训练期间以概率随机地将一部分神经元的输出设置为零，称为“丢弃”。通过绘制训练误差和验证误差的曲线，以及早停法的标记点，可以更加直观地观察到模型的优化过程和选择最佳模型时的判定点。上述代码生成了一些具有噪声的样本数据，并构建了一个简单的具有Dropout正则化的神经网络模型。通过增强后的数据集，模型能够更好地捕捉到数据的不同特征和变化，使得模型能够更好地区分两个类别。通过这种方式，Dropout 正则化可以减少神经元之间的依赖性，提高模型的鲁棒性。

2024-06-24 14:32:07 635

原创机器学习各个算法的优缺点！（下篇）建议收藏。

选择适当的深度学习算法通常取决于问题的性质、数据类型和计算资源的可用性。选择适当的降维方法通常取决于数据的性质、问题的要求以及计算资源的可用性。不同的降维方法适用于不同的问题和数据类型。贝叶斯方法在处理不确定性、概率建模、优化和模式识别等方面具有广泛的应用，但不同的分支适用于不同类型的问题和数据。选择适当的贝叶斯方法通常取决于问题的要求和计算资源的可用性。选择适当的聚类方法通常取决于数据的性质、问题的要求以及计算资源的可用性。选择适当的神经网络架构通常取决于问题的性质、数据类型和计算资源的可用性。

2024-06-23 09:53:25 823

原创机器学习各个算法的优缺点！（上篇）建议收藏。

回归正则化算法集成算法决策树算法支持向量机降维算法聚类算法贝叶斯算法人工神经网络深度学习。

2024-06-23 09:52:48 1179

原创【建议收藏】逻辑回归面试题，机器学习干货、重点。

逻辑回归的目标函数，通常也称为损失函数或代价函数，用于衡量模型的预测与实际观测值之间的差异。逻辑回归通常用于二分类问题，其目标是最大化观测数据属于正类别或负类别的概率，从而能够进行分类。逻辑回归的目标函数通常使用交叉熵损失函数（Cross-Entropy Loss Function）或对数损失函数（Log Loss Function），这两者通常是等价的。逻辑回归的交叉熵损失函数对于二分类问题，逻辑回归的损失函数可以表示为以下形式：其中：是损失函数。是训练样本数量。

2024-06-22 08:50:32 1004

原创机器学习7大方面，30个硬核数据集。纯干货分享

选择适当的数据集、数据清洗、特征工程和数据预处理等步骤都需要谨慎处理，以确保模型能够在实际应用中取得良好的效果。数据集的质量和数量都是决定模型成功的关键要素。数据集的大小和质量可以影响模型的过拟合和欠拟合情况。一个好的数据集可以让模型更准确，而低质量或小规模的数据集可能导致模型表现不佳。的30个常见机器学习数据集，以及每个数据集的介绍、获取链接和可能涉及到的算法。好的数据集能够确保模型在不同数据上的泛化能力。合适的特征选择和工程能够提高模型的泛化能力。数据集的不平衡分布或偏斜可能导致模型的偏差。

2024-06-22 08:49:39 1198

原创深度学习各算法的优缺点和适用场景！！纯干货，建议收藏。（下篇）

深度学习通过多层神经网络模型来学习和表示数据的高级特征。。深度学习现在的重要作用是大家有目共睹的。先来简单来聊聊在算法领域和实际工业领域都发挥了哪些重要的作用。1、：深度学习可以用于解决复杂的模式识别问题，如图像分类、语音识别和自然语言处理。深度卷积神经网络和循环神经网络等模型在这些任务中取得了巨大的成功。2、：深度学习可用于生成新的数据，包括图像、文本和音频。生成对抗网络和变分自编码器等生成模型已经被广泛应用于图像生成、自然语言生成和音乐合成等任务。3、

2024-06-21 14:03:35 1040

原创深度学习各算法的优缺点和适用场景！！纯干货，建议收藏。（下篇）

今天演示了深度学习各分支算法的优缺点和适用场景！

2024-06-21 14:02:04 725

原创【建议收藏】30个硬核Python脚本，纯干货分享

纯干货.本篇较难，；接上篇文章，对于Pyhon的学习，上篇学习的结束相信大家对于Pyhon有了一定的理解和经验，学习完上篇文章之后再研究研究剩下的30个脚本你将会有所成就！加油！

2024-06-20 08:23:21 1120

原创【建议收藏】20个硬核Python脚本，纯干货分享

另外，每个模块底部提供了对于官网文档，更加方便的查询具体的使用方法。内容由简到难，如果对你有帮助的话希望。

2024-06-20 08:22:56 704

原创 ❤【纯干货】Matplotlib总结，任何项目都用得到❤

总的来说，Matplotlib 是一个强大而灵活的 Python 数据可视化工具，可用于创建各种类型的图表，帮助用户更好地理解和呈现数据。如果你需要在数据分析和可视化中使用 Python，Matplotlib 是一个不可或缺的工具之一。

2024-06-19 07:26:27 1005

原创特别实用的8个机器学习算法总结！建议收藏，反复观看！

今天介绍了8个机器学习中回归类算法的总结，以及不同情况使用的特征。线性回归：适用于特征与目标之间呈线性关系的情况，例如简单的回归分析、连续型数值预测等。多项式回归：当特征与目标之间的关系呈现出非线性趋势时，可以使用多项式回归来拟合曲线关系，适用于二次、三次等多项式关系。岭回归：在线性回归中存在多重共线性（特征之间高度相关）时，岭回归可以用来稳定模型。它也有助于防止过拟合。Lasso回归：适用于具有许多特征的数据集，可以帮助选择最重要的特征，同时进行特征选择和回归。弹性网络回归。

2024-06-19 07:25:25 699

原创机器学习正则化算法的总结，建议收藏。（下篇）

纯干货L1 正则化L2 正则化弹性网络正则化Dropout 正则化贝叶斯Ridge和Lasso回归早停法数据增强上篇讲了前五种，这篇记录后两种。直接步入主题，

2024-06-18 08:35:01 667

原创机器学习正则化算法的总结，建议收藏。（上篇）

纯干货正则化通过在模型的损失函数中添加一个正则项（惩罚项）来实现。这个正则项通常基于模型参数的大小，以限制模型参数的数量或幅度。：L1正则化添加了模型参数的绝对值之和作为正则项。它倾向于使一些参数变为零，从而达到特征选择的效果。所以，L1正则化可以用于自动选择最重要的特征，并减少模型复杂度。：L2正则化添加了模型参数的平方和作为正则项。它倾向于使所有参数都较小，但没有明确地将某些参数设置为零。L2正则化对异常值更加鲁棒，并且可以减少模型的过度依赖单个特征的情况。

2024-06-18 08:34:16 1397

原创机器学习中的神经网络重难点！纯干货（上篇）

人工神经网络（Artificial Neural Network，ANN）是一种受到生物神经系统启发的计算模型，用于模拟和处理复杂的信息处理任务。人工神经网络由许多神经元（或称为节点）组成，这些神经元通过连接（也称为权重）相互连接，形成了一个网络结构，以模拟大脑中神经细胞之间的相互作用。下面，咱们大概介绍一下关于 ANN 的和1、：神经元是神经网络的基本单元，它们接收输入、执行计算并生成输出。每个神经元都有一个激活函数，用于将输入信号转换为输出信号。

2024-06-17 09:31:27 515

原创机器学习中的神经网络重难点！纯干货（下篇）

这个重要性是通过计算一个权重值的方式来实现的，而这个权重值是根据输入的相似性来决定的。重要的是，这种计算是基于输入数据本身完成的，因此不受序列长度的限制。要注意的是，这个示例的数据和任务仅用于演示Transformer模型的使用方式。判别器也是一个神经网络，它会对输入的数据进行评估，输出一个0到1之间的概率值，表示数据的真实程度。：基于当前的输入和细胞状态，LSTM生成新的输出和细胞状态，这将成为下一个时间步的输入。：判别器的目标是最小化，其中是判别器对真实数据的评价，是对生成器生成数据的评价。

2024-06-17 09:30:43 604

原创机器学习：在Python中sklearn库的使用，纯干货！12个小时的整理！

无监督学习是在没有标签的数据上训练的。其主要目的可能包括聚类、降维、生成模型等。以下是 6 个重要的无监督学习算法，这些算法都可以通过使用（Scikit-learn）库在Python中很好地处理：目录K-Means 聚类层次聚类DBSCAN主成分分析独立成分分析高斯混合模型数据准备首先，我们导入必要的库和数据，并进行基本的数据探查。这里，准备了名称为「customer_data.csv」的数据集，维度分别为``AgeAnnual_IncomeSpending_Score`作为 3 个特征。获取数据集：

2024-06-16 09:09:18 750

原创机器学习中的神经网络重难点！纯干货（上篇）

人工神经网络（Artificial Neural Network，ANN）是一种受到生物神经系统启发的计算模型，用于模拟和处理复杂的信息处理任务。人工神经网络由许多神经元（或称为节点）组成，这些神经元通过连接（也称为权重）相互连接，形成了一个网络结构，以模拟大脑中神经细胞之间的相互作用。下面，咱们大概介绍一下关于 ANN 的和1、：神经元是神经网络的基本单元，它们接收输入、执行计算并生成输出。每个神经元都有一个激活函数，用于将输入信号转换为输出信号。

2024-06-16 09:08:46 795

原创深度学习各算法的优缺点和适用场景！！纯干货，建议收藏。（上篇）

深度学习通过多层神经网络模型来学习和表示数据的高级特征。。深度学习现在的重要作用是大家有目共睹的。先来简单来聊聊在算法领域和实际工业领域都发挥了哪些重要的作用。1、：深度学习可以用于解决复杂的模式识别问题，如图像分类、语音识别和自然语言处理。深度卷积神经网络和循环神经网络等模型在这些任务中取得了巨大的成功。2、：深度学习可用于生成新的数据，包括图像、文本和音频。生成对抗网络和变分自编码器等生成模型已经被广泛应用于图像生成、自然语言生成和音乐合成等任务。3、

2024-06-08 09:52:41 1251

原创深度学习各算法的优缺点和适用场景！！纯干货，建议收藏。（下篇）

建议优先学习上篇，上篇更精彩。

2024-06-08 09:52:04 1598

原创【❤】机器学习中10种损失函数大梳理【❤】

是在机器学习和深度学习中用来衡量模型预测值与真实标签之间差异的函数。不同的任务和模型可能需要不同的损失函数。今天就聊聊下面常见的损失函数，关于原理、使用场景，并且给出完整的代码：均方误差平均绝对误差交叉熵损失对数损失多类别交叉熵损失二分类交叉熵损失余弦相似度损失希尔伯特-施密特口袋Huber损失感知器损失ok，咱们一起来学习一下~

2024-06-07 10:05:26 1259

原创【❤】15个硬核机器学习库【❤】

今天就从每种 Python 库的。

2024-06-07 10:03:33 555

原创 6大部分，20 个机器学习算法全面汇总！！建议收藏！（上篇）

纯干货本次文章分别从下面6个方面，涉及到20个算法知识点：监督学习算法无监督学习算法半监督学习算法强化学习算法集成学习算法深度学习算法。

2024-06-06 12:59:53 739

原创 6大部分，20 个机器学习算法全面汇总！！建议收藏！（下篇）

好了，朋友们，上面咱们列举的 20 个机器学习的核心原理和思路，算是有效的帮助大家做了一个总结！每种算法都有其自身的优点和适用领域，选择算法取决于任务的性质和数据的特点。喜欢的朋友可以起来！

2024-06-06 12:58:44 750

原创机器学习过拟合和欠拟合！看这一篇文章就够了建议收藏！

今天介绍了过拟合和欠拟合，以及代码案例，并且给出的解决方案。喜欢的朋友可以起来！

2024-06-05 08:30:35 1295

原创 [建议收藏！]一篇文章告诉你聚类算法的作用和怎么用聚类算法！

1、选择要分成的簇的数量K。2、随机初始化K个中心点，这些中心点可以是从数据集中随机选择的数据点。3、重复以下过程，直到满足停止条件：将每个数据点分配到距离其最近的中心点所属的簇。对每个簇，计算所有数据点的平均值，并将其作为新的中心点。停止条件通常可以是以下之一：中心点不再改变或改变非常小。数据点不再改变其所属簇。凝聚聚类（Agglomerative Clustering）：从底部开始，每个数据点被视为一个单独的簇，然后迭代地合并最接近的簇，直到只剩下一个大的簇。

2024-06-05 08:30:19 1108

原创硬核集成算法，学习完你会哭着感谢自己！

今天介绍了5个机器学习中关于集成学习的总结，包括Bagging、Boosting、Stacking、Voting、深度学习集成。

2024-06-04 13:07:15 459

原创【耗时十个小时】程序员最趁手的SVM算法，学完你会哭着感谢努力的自己！

❤ 纯干货 ❤在这之前咱们已经接触了各个算法的优缺点的总结，以及8个回归类算法、7个正则化算法的总结、5 个集成算法模型的全部总结！感兴趣的可以翻到之前看看~咱们今天就大概一起学习一下关于SVM的方方面面。线性支持向量机非线性支持向量机多类别支持向量机核函数支持向量机稀疏支持向量机核贝叶斯支持向量机不平衡类别支持向量机！：SVM支持向量机在解决分类和回归问题上表现出色，可应用于各种数据类型和领域，例如文本分类、图像识别和生物信息学等。

2024-06-04 13:06:15 1210

原创 Matplotlib总结，任何项目都用得到。收藏备用。

总的来说，Matplotlib 是一个强大而灵活的 Python 数据可视化工具，可用于创建各种类型的图表，帮助用户更好地理解和呈现数据。如果你需要在数据分析和可视化中使用 Python，Matplotlib 是一个不可或缺的工具之一。

2024-06-03 11:02:09 447

原创 ❤机器学习正则化算法的总结。耗时10个小时完成。❤

❤纯干货~❤正则化通过在模型的损失函数中添加一个正则项（惩罚项）来实现。这个正则项通常基于模型参数的大小，以限制模型参数的数量或幅度。：L1正则化添加了模型参数的绝对值之和作为正则项。它倾向于使一些参数变为零，从而达到特征选择的效果。所以，L1正则化可以用于自动选择最重要的特征，并减少模型复杂度。：L2正则化添加了模型参数的平方和作为正则项。它倾向于使所有参数都较小，但没有明确地将某些参数设置为零。L2正则化对异常值更加鲁棒，并且可以减少模型的过度依赖单个特征的情况。

2024-06-03 11:01:07 1398

原创机器学习中的神经网络重难点！纯干货（上篇）

人工神经网络（Artificial Neural Network，ANN）是一种受到生物神经系统启发的计算模型，用于模拟和处理复杂的信息处理任务。人工神经网络由许多神经元（或称为节点）组成，这些神经元通过连接（也称为权重）相互连接，形成了一个网络结构，以模拟大脑中神经细胞之间的相互作用。下面，咱们大概介绍一下关于 ANN 的和1、：神经元是神经网络的基本单元，它们接收输入、执行计算并生成输出。每个神经元都有一个激活函数，用于将输入信号转换为输出信号。

2024-06-02 07:34:14 1074

原创机器学习中的神经网络重难点！纯干货（下篇）

这个重要性是通过计算一个权重值的方式来实现的，而这个权重值是根据输入的相似性来决定的。重要的是，这种计算是基于输入数据本身完成的，因此不受序列长度的限制。要注意的是，这个示例的数据和任务仅用于演示Transformer模型的使用方式。判别器也是一个神经网络，它会对输入的数据进行评估，输出一个0到1之间的概率值，表示数据的真实程度。：基于当前的输入和细胞状态，LSTM生成新的输出和细胞状态，这将成为下一个时间步的输入。：判别器的目标是最小化，其中是判别器对真实数据的评价，是对生成器生成数据的评价。

2024-06-02 07:33:35 757

原创机器学习初学者 6 个核心算法！建议收藏，反复观看！

今天再来介绍首先，引用一句英国统计学家George E. P. Box的名言：All models are wrong, but some are useful. 没有哪一种算法能够适用所有情况，只有针对某一种问题更有用的算法。也就是说，机器学习算法不会要求一个问题被 100%求解，取而代之的是把问题转化为最优化的问题，用不同的算法优化问题，从而比较得到尽量好的结果。因此对于数据科学家来说，理解算法显得格外重要，理解不同算法的思想可以帮助数据科学家更从容地面对不同的应用场景。

2024-06-01 10:22:35 801 1

原创特别实用的8个机器学习算法总结！建议收藏，反复观看！

今天介绍了8个机器学习中回归类算法的总结，以及不同情况使用的特征。线性回归：适用于特征与目标之间呈线性关系的情况，例如简单的回归分析、连续型数值预测等。多项式回归：当特征与目标之间的关系呈现出非线性趋势时，可以使用多项式回归来拟合曲线关系，适用于二次、三次等多项式关系。岭回归：在线性回归中存在多重共线性（特征之间高度相关）时，岭回归可以用来稳定模型。它也有助于防止过拟合。Lasso回归：适用于具有许多特征的数据集，可以帮助选择最重要的特征，同时进行特征选择和回归。弹性网络回归。

2024-06-01 10:21:29 1003

原创线性回归 10 种图表上

至于数据集，表现方式，大家可以根据我给出的代码继续调整即可！

2024-05-31 08:26:17 791

原创线性回归 10 种图表下

偏差-方差权衡是一个重要的概念，它告诉我们在训练模型时要权衡这两种误差，并避免过拟合（高方差、低偏差）或欠拟合（低方差、高偏差）。杠杆值反映了每个数据点对模型参数估计的影响程度，具有高杠杆值的数据点可能会对模型的拟合产生较大影响。它通过绘制一个自变量与因变量之间的关系图，同时控制其他自变量的影响，来帮助我们理解这个自变量独立于其他变量时对因变量的影响程度。通过观察Cook's 距离，我们可以找出这些数据点，并进一步分析它们对模型的影响，以优化模型的拟合效果。这种图表有助于我们优化模型并提高预测的准确性。

2024-05-31 08:25:32 720

原创特别实用的8个机器学习算法总结！建议收藏，反复观看！

今天介绍了8个机器学习中回归类算法的总结，以及不同情况使用的特征。线性回归：适用于特征与目标之间呈线性关系的情况，例如简单的回归分析、连续型数值预测等。多项式回归：当特征与目标之间的关系呈现出非线性趋势时，可以使用多项式回归来拟合曲线关系，适用于二次、三次等多项式关系。岭回归：在线性回归中存在多重共线性（特征之间高度相关）时，岭回归可以用来稳定模型。它也有助于防止过拟合。Lasso回归：适用于具有许多特征的数据集，可以帮助选择最重要的特征，同时进行特征选择和回归。弹性网络回归。

2024-05-30 07:11:10 675

原创机器学习初学者 6 个核心算法！建议收藏，反复观看！

今天再来介绍首先，引用一句英国统计学家George E. P. Box的名言：All models are wrong, but some are useful. 没有哪一种算法能够适用所有情况，只有针对某一种问题更有用的算法。也就是说，机器学习算法不会要求一个问题被 100%求解，取而代之的是把问题转化为最优化的问题，用不同的算法优化问题，从而比较得到尽量好的结果。因此对于数据科学家来说，理解算法显得格外重要，理解不同算法的思想可以帮助数据科学家更从容地面对不同的应用场景。

2024-05-30 07:10:20 800

空空如也

【田忌赛马问题】蛮力法实现的全排列算法

patch_artist：设置为True以允许自定义箱线图的样式。

常见机器学习算法的优缺点概述，以及它们在不同应用场景中的适用性：

用这个字典来存储用户的历史记录

user_history = {}

、深度强化学习Seq2Seq（Deep Reinforcement Learning Seq2Seq）

反向传播（Backpropagation）：反向传播是一种迭代的优化过程，用于根据损失函数的梯度调整连接权重，以改进神经网络的性能。这个过程从输出层向后传递误差信号，并根据误差信号来更新权重。

早停法（Early Stopping）是一种用于防止模型过拟合的正则化技术。

在 其中，(\alpha)是平衡L1和L2正则化影响的参数。 使用Python实现

slkearn的使用方法

关于向量机，学习有什么技巧

关于机器学习基础与实际（相关搜索：机器学习）

支持向量机是什么？什么时候会用？

深度学习各算法的优缺点和适用场景！

给我讲清楚机器学习的库（相关搜索：机器学习）

关于svm算法的学习，有什么好办法

怎么样更快的学会机器学习呢？机器学习的重难点是什么

机器学习中，哪些是线性算法（相关搜索：机器学习）

卷积神经的使用方法是什么，什么情况下更好

在其中，(\alpha)是平衡L1和L2正则化影响的参数。使用Python实现