自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(106)
  • 收藏
  • 关注

原创 【耗时八个小时】机器学习过拟合和欠拟合!看这一篇文章就够了

.

2024-06-25 08:53:20 958

原创 程序员最趁手的SVM算法,学完你会哭着感谢努力的自己!

另外,非线性SVM的数学公式比较复杂,但我们可以简化为:它是一种方法,可以将数据映射到一个不同的空间,然后在那个空间中使用线性SVM。我们还有k个类别,用1到k的数字表示。它的目标是找到一个能够在数据中画出一条直线(或者高维空间中的超平面),将不同类别的数据点分隔开,并且最大化两侧最靠近这条线的数据点之间的距离。:SVM支持向量机对于训练数据中的噪声和异常点具有一定的鲁棒性,可以有效地处理输入数据中的噪声。核贝叶斯支持向量机通过学习一些已知的例子,并找到一个特殊的边界,用于将不同的事物区分开来。

2024-06-25 08:52:02 977

原创 ❤【纯干货】Matplotlib总结,任何项目都用得到❤

❤纯 干 货❤目录1、绘制基本图形2、定制化图形3、支持多个坐标轴4、3D绘图5、动态交互绘图6、绘制地图7、绘制统计图表最后 在很多人眼里是无敌的存在,而且可以说是无敌的存在。走过数据科学的路,路上必然有 的风景在你周围。如果同一个项目,你的用了matplotlib 不仅有基本图形、定制化图形、多个坐标轴、3D绘图,还有动态交互绘图、绘制地图、绘制统计图表,甚至还有地图分布!那么谁的更吸引人呢?收藏备用,一定用的上!是一个功能强大且广泛使用的数据可视化工具,特别适用于科学计算、数据分析和数据科学领

2024-06-24 14:47:38 615

原创 ❤机器学习正则化算法的总结。耗时10个小时完成。❤

Dropout 正则化的原理是,在训练期间以概率 随机地将一部分神经元的输出设置为零,称为“丢弃”。通过绘制训练误差和验证误差的曲线,以及早停法的标记点,可以更加直观地观察到模型的优化过程和选择最佳模型时的判定点。上述代码生成了一些具有噪声的样本数据,并构建了一个简单的具有Dropout正则化的神经网络模型。通过增强后的数据集,模型能够更好地捕捉到数据的不同特征和变化,使得模型能够更好地区分两个类别。通过这种方式,Dropout 正则化可以减少神经元之间的依赖性,提高模型的鲁棒性。

2024-06-24 14:45:55 519

原创 机器学习各个算法的优缺点!(下篇) 建议收藏。

纯 干 货!....直接进入主题。

2024-06-23 09:43:55 463

原创 机器学习各个算法的优缺点!(上篇) 建议收藏。

回归正则化算法集成算法决策树算法支持向量机降维算法聚类算法贝叶斯算法人工神经网络深度学习。

2024-06-23 09:43:41 1006

原创 【建议收藏】逻辑回归面试题,机器学习干货、重点。

逻辑回归的目标函数,通常也称为损失函数或代价函数,用于衡量模型的预测与实际观测值之间的差异。逻辑回归通常用于二分类问题,其目标是最大化观测数据属于正类别或负类别的概率,从而能够进行分类。逻辑回归的目标函数通常使用交叉熵损失函数(Cross-Entropy Loss Function)或对数损失函数(Log Loss Function),这两者通常是等价的。逻辑回归的交叉熵损失函数对于二分类问题,逻辑回归的损失函数可以表示为以下形式:其中:是损失函数。是训练样本数量。

2024-06-22 08:46:28 936

原创 机器学习7大方面,30个硬核数据集。纯干货分享

选择适当的数据集、数据清洗、特征工程和数据预处理等步骤都需要谨慎处理,以确保模型能够在实际应用中取得良好的效果。数据集的质量和数量都是决定模型成功的关键要素。数据集的大小和质量可以影响模型的过拟合和欠拟合情况。一个好的数据集可以让模型更准确,而低质量或小规模的数据集可能导致模型表现不佳。的30个常见机器学习数据集,以及每个数据集的介绍、获取链接和可能涉及到的算法。好的数据集能够确保模型在不同数据上的泛化能力。合适的特征选择和工程能够提高模型的泛化能力。数据集的不平衡分布或偏斜可能导致模型的偏差。

2024-06-22 08:43:05 812

原创 深度学习各算法的优缺点和适用场景!!纯干货,建议收藏。(下篇)

纯 干 货。

2024-06-21 13:54:09 889

原创 深度学习各算法的优缺点和适用场景!!纯干货,建议收藏。(上篇)

纯 干 货​深度学习通过多层神经网络模型来学习和表示数据的高级特征。。深度学习现在的重要作用是大家有目共睹的。先来简单来聊聊在算法领域和实际工业领域都发挥了哪些重要的作用。1、:深度学习可以用于解决复杂的模式识别问题,如图像分类、语音识别和自然语言处理。深度卷积神经网络 和 循环神经网络等模型在这些任务中取得了巨大的成功。2、:深度学习可用于生成新的数据,包括图像、文本和音频。生成对抗网络和变分自编码器等生成模型已经被广泛应用于图像生成、自然语言生成和音乐合成等任务。3、

2024-06-21 13:51:50 881

原创 【建议收藏】30个较难Python脚本,纯干货分享

纯 干 货. 本篇较难,;接上篇文章,对于Pyhon的学习,上篇学习的结束相信大家对于Pyhon有了一定的理解和经验,学习完上篇文章之后再研究研究剩下的30个脚本你将会有所成就!加油!

2024-06-20 08:27:56 967

原创 【建议收藏】20个硬核Python脚本,纯干货分享

另外,每个模块底部提供了对于官网文档,更加方便的查询具体的使用方法。内容由简到难,如果对你有帮助的话希望。

2024-06-20 08:26:45 997

原创 特别实用的8个机器学习算法总结!建议收藏,反复观看!

今天介绍了8个机器学习中回归类算法的总结,以及不同情况使用的特征。线性回归: 适用于特征与目标之间呈线性关系的情况,例如简单的回归分析、连续型数值预测等。多项式回归:当特征与目标之间的关系呈现出非线性趋势时,可以使用多项式回归来拟合曲线关系,适用于二次、三次等多项式关系。岭回归: 在线性回归中存在多重共线性(特征之间高度相关)时,岭回归可以用来稳定模型。它也有助于防止过拟合。Lasso回归: 适用于具有许多特征的数据集,可以帮助选择最重要的特征,同时进行特征选择和回归。弹性网络回归。

2024-06-19 07:48:20 778

原创 ❤【纯干货】Matplotlib总结,任何项目都用得到❤

总的来说,Matplotlib 是一个强大而灵活的 Python 数据可视化工具,可用于创建各种类型的图表,帮助用户更好地理解和呈现数据。如果你需要在数据分析和可视化中使用 Python,Matplotlib 是一个不可或缺的工具之一。

2024-06-19 07:48:08 895

原创 机器学习正则化算法的总结,建议收藏。(下篇)

纯干货L1 正则化L2 正则化弹性网络正则化Dropout 正则化贝叶斯Ridge和Lasso回归早停法数据增强上篇讲了前五种,这篇记录后两种。直接步入主题,

2024-06-18 08:25:39 565

原创 机器学习正则化算法的总结,建议收藏。(上篇)

纯 干 货正则化通过在模型的损失函数中添加一个正则项(惩罚项)来实现。这个正则项通常基于模型参数的大小,以限制模型参数的数量或幅度。:L1正则化添加了模型参数的绝对值之和作为正则项。它倾向于使一些参数变为零,从而达到特征选择的效果。所以,L1正则化可以用于自动选择最重要的特征,并减少模型复杂度。:L2正则化添加了模型参数的平方和作为正则项。它倾向于使所有参数都较小,但没有明确地将某些参数设置为零。L2正则化对异常值更加鲁棒,并且可以减少模型的过度依赖单个特征的情况。

2024-06-18 08:24:55 1081

原创 机器学习中的神经网络重难点!纯干货(上篇)

人工神经网络(Artificial Neural Network,ANN)是一种受到生物神经系统启发的计算模型,用于模拟和处理复杂的信息处理任务。人工神经网络由许多神经元(或称为节点)组成,这些神经元通过连接(也称为权重)相互连接,形成了一个网络结构,以模拟大脑中神经细胞之间的相互作用。下面,咱们大概介绍一下关于 ANN 的和1、:神经元是神经网络的基本单元,它们接收输入、执行计算并生成输出。每个神经元都有一个激活函数,用于将输入信号转换为输出信号。

2024-06-17 09:26:49 1077

原创 机器学习中的神经网络重难点!纯干货(下篇)

这个重要性是通过计算一个权重值的方式来实现的,而这个权重值是根据输入的相似性来决定的。重要的是,这种计算是基于输入数据本身完成的,因此不受序列长度的限制。要注意的是,这个示例的数据和任务仅用于演示Transformer模型的使用方式。判别器也是一个神经网络,它会对输入的数据进行评估,输出一个0到1之间的概率值,表示数据的真实程度。:基于当前的输入和细胞状态,LSTM生成新的输出和细胞状态,这将成为下一个时间步的输入。:判别器的目标是最小化,其中是判别器对真实数据的评价,是对生成器生成数据的评价。

2024-06-17 09:26:17 652

原创 机器学习:在Python中sklearn库的使用,纯干货!12个小时的整理!

..........无监督学习是在没有标签的数据上训练的。其主要目的可能包括聚类、降维、生成模型等。以下是 6 个重要的无监督学习算法,这些算法都可以通过使用(Scikit-learn)库在Python中很好地处理:目录K-Means 聚类层次聚类DBSCAN主成分分析独立成分分析高斯混合模型数据准备首先,我们导入必要的库和数据,并进行基本的数据探查。这里,准备了名称为「customer_data.csv」的数据集,维度分别为``AgeAnnual_IncomeSpending_Score`作为 3 个特征

2024-06-16 09:03:41 1091

原创 机器学习中的神经网络重难点!纯干货(上篇)

人工神经网络(Artificial Neural Network,ANN)是一种受到生物神经系统启发的计算模型,用于模拟和处理复杂的信息处理任务。人工神经网络由许多神经元(或称为节点)组成,这些神经元通过连接(也称为权重)相互连接,形成了一个网络结构,以模拟大脑中神经细胞之间的相互作用。下面,咱们大概介绍一下关于 ANN 的和1、:神经元是神经网络的基本单元,它们接收输入、执行计算并生成输出。每个神经元都有一个激活函数,用于将输入信号转换为输出信号。

2024-06-16 09:02:35 708

原创 中国同胞进来看看,很多外国人想通过CSDN坑咱们中国人

地址:【诈骗离你我很近】中国同胞进来看看国外诈骗新套路。-CSDN博客

2024-06-09 20:05:44 298

原创 【诈骗离你我很近】中国同胞进来看看国外诈骗新套路。

他名字应该是假的,但是他应该是真的外国人。还会跟我分享他的日常,现在想想,他从来没问过我在那个城市,我想到过他来中国会愿意来我这小市玩吗?英国和中国有时差,大概八个小时,我故意说睡觉,然后五点时候问他在干什么,如果他真的在英国,大概八九点的样子,他肯定能看到消息。他说给我寄过来了,说必须二次支付,我上网查了查,发现他在骗我,是可以一次付清的。但是我还是信他,我没有邮寄过国际快递,我以为是我认知问题。这时候,他说他有个困扰,我看见了,我第一时间没理他,我以为他会说,但是他引用了一下发了问号提醒我。

2024-06-09 19:59:43 661

原创 深度学习各算法的优缺点和适用场景!!纯干货,建议收藏。(下篇)

建议优先学习上篇,上篇更精彩。

2024-06-08 09:27:59 1041

原创 【纯干货】深度学习各算法的优缺点和适用场景!建议收藏。(上篇)

纯 干 货深度学习通过多层神经网络模型来学习和表示数据的高级特征。。深度学习现在的重要作用是大家有目共睹的。先来简单来聊聊在算法领域和实际工业领域都发挥了哪些重要的作用。1、:深度学习可以用于解决复杂的模式识别问题,如图像分类、语音识别和自然语言处理。深度卷积神经网络 和 循环神经网络等模型在这些任务中取得了巨大的成功。2、:深度学习可用于生成新的数据,包括图像、文本和音频。生成对抗网络和变分自编码器等生成模型已经被广泛应用于图像生成、自然语言生成和音乐合成等任务。3、

2024-06-08 09:26:57 947

原创 【耗时十小时整理!】15个硬核机器学习库。

今天就从每种 Python 库的。

2024-06-07 07:43:02 843

原创 【大梳理】机器学习中10种损失函数大梳理!建议收藏

是在机器学习和深度学习中用来衡量模型预测值与真实标签之间差异的函数。不同的任务和模型可能需要不同的损失函数。今天就聊聊下面常见的损失函数,关于原理、使用场景,并且给出完整的代码:均方误差平均绝对误差交叉熵损失对数损失多类别交叉熵损失二分类交叉熵损失余弦相似度损失希尔伯特-施密特口袋Huber损失感知器损失ok,咱们一起来学习一下~

2024-06-07 07:40:47 1189

原创 6大部分,20 个机器学习算法全面汇总!!建议收藏!(上篇)

前两天有小伙伴说想要把常见算法的原理 + 公式汇集起来。本次文章分别从下面6个方面,涉及到20个算法知识点:监督学习算法无监督学习算法半监督学习算法强化学习算法集成学习算法深度学习算法。

2024-06-06 12:50:39 1237

原创 6大部分,20 个机器学习算法全面汇总!!建议收藏!(下篇)

好了,朋友们,上面咱们列举的 20 个机器学习的核心原理和思路,算是有效的帮助大家做了一个总结!每种算法都有其自身的优点和适用领域,选择算法取决于任务的性质和数据的特点。喜欢的朋友可以起来!

2024-06-06 12:49:17 1248

原创 [建议收藏!]一篇文章告诉你聚类算法的作用和怎么用聚类算法!

1、选择要分成的簇的数量K。2、随机初始化K个中心点,这些中心点可以是从数据集中随机选择的数据点。3、重复以下过程,直到满足停止条件:将每个数据点分配到距离其最近的中心点所属的簇。对每个簇,计算所有数据点的平均值,并将其作为新的中心点。停止条件通常可以是以下之一:中心点不再改变或改变非常小。数据点不再改变其所属簇。凝聚聚类(Agglomerative Clustering):从底部开始,每个数据点被视为一个单独的簇,然后迭代地合并最接近的簇,直到只剩下一个大的簇。

2024-06-05 07:59:52 681

原创 【耗时八个小时】机器学习过拟合和欠拟合!看这一篇文章就够了

今天介绍了过拟合和欠拟合,以及代码案例,并且给出的解决方案。喜欢的朋友可以起来!

2024-06-05 07:56:52 1334

原创 程序员最趁手的SVM算法,学完你会哭着感谢努力的自己!

纯 干 货在这之前咱们已经接触了 各个算法的优缺点的总结,以及8个回归类算法、7个正则化算法的总结、5 个集成算法模型的全部总结!感兴趣的可以翻到之前看看~咱们今天就大概一起学习一下关于SVM的方方面面。线性支持向量机非线性支持向量机多类别支持向量机核函数支持向量机稀疏支持向量机核贝叶斯支持向量机不平衡类别支持向量机!:SVM支持向量机在解决分类和回归问题上表现出色,可应用于各种数据类型和领域,例如文本分类、图像识别和生物信息学等。

2024-06-04 13:01:09 1101

原创 【耗时8个小时整理】硬核集成算法,学习完你会哭着感谢自己!

今天介绍了5个机器学习中关于集成学习的总结,包括Bagging、Boosting、Stacking、Voting、深度学习集成。

2024-06-04 13:00:55 959

原创 Matplotlib总结,任何项目都用得到。收藏备用。

总的来说,Matplotlib 是一个强大而灵活的 Python 数据可视化工具,可用于创建各种类型的图表,帮助用户更好地理解和呈现数据。如果你需要在数据分析和可视化中使用 Python,Matplotlib 是一个不可或缺的工具之一。

2024-06-03 10:54:39 1132

原创 机器学习正则化算法的总结。耗时10个小时完成。

纯干货正则化通过在模型的损失函数中添加一个正则项(惩罚项)来实现。这个正则项通常基于模型参数的大小,以限制模型参数的数量或幅度。:L1正则化添加了模型参数的绝对值之和作为正则项。它倾向于使一些参数变为零,从而达到特征选择的效果。所以,L1正则化可以用于自动选择最重要的特征,并减少模型复杂度。:L2正则化添加了模型参数的平方和作为正则项。它倾向于使所有参数都较小,但没有明确地将某些参数设置为零。L2正则化对异常值更加鲁棒,并且可以减少模型的过度依赖单个特征的情况。

2024-06-03 10:53:08 1194

原创 机器学习各个算法的优缺点!(上篇) 建议收藏。

纯干货!!回归正则化算法集成算法决策树算法支持向量机降维算法聚类算法贝叶斯算法人工神经网络深度学习。

2024-06-02 07:02:45 1174

原创 机器学习各个算法的优缺点!(下篇) 建议收藏。

纯干货!直接进入主题。

2024-06-02 07:01:56 808

原创 特别实用的8个机器学习算法总结!建议收藏,反复观看!

今天介绍了8个机器学习中回归类算法的总结,以及不同情况使用的特征。线性回归: 适用于特征与目标之间呈线性关系的情况,例如简单的回归分析、连续型数值预测等。多项式回归:当特征与目标之间的关系呈现出非线性趋势时,可以使用多项式回归来拟合曲线关系,适用于二次、三次等多项式关系。岭回归: 在线性回归中存在多重共线性(特征之间高度相关)时,岭回归可以用来稳定模型。它也有助于防止过拟合。Lasso回归: 适用于具有许多特征的数据集,可以帮助选择最重要的特征,同时进行特征选择和回归。弹性网络回归。

2024-06-01 10:18:48 1011

原创 机器学习初学者 6 个核心算法!建议收藏,反复观看!

今天再来介绍首先,引用一句英国统计学家George E. P. Box的名言:All models are wrong, but some are useful. 没有哪一种算法能够适用所有情况,只有针对某一种问题更有用的算法。也就是说,机器学习算法不会要求一个问题被 100%求解,取而代之的是把问题转化为最优化的问题,用不同的算法优化问题,从而比较得到尽量好的结果。因此对于数据科学家来说,理解算法显得格外重要,理解不同算法的思想可以帮助数据科学家更从容地面对不同的应用场景。

2024-06-01 10:18:12 629

原创 线性回归 10 种图表 下

偏差-方差权衡是一个重要的概念,它告诉我们在训练模型时要权衡这两种误差,并避免过拟合(高方差、低偏差)或欠拟合(低方差、高偏差)。杠杆值反映了每个数据点对模型参数估计的影响程度,具有高杠杆值的数据点可能会对模型的拟合产生较大影响。它通过绘制一个自变量与因变量之间的关系图,同时控制其他自变量的影响,来帮助我们理解这个自变量独立于其他变量时对因变量的影响程度。通过观察Cook's 距离,我们可以找出这些数据点,并进一步分析它们对模型的影响,以优化模型的拟合效果。这种图表有助于我们优化模型并提高预测的准确性。

2024-05-31 08:17:07 677

原创 线性回归 10 种图表 上

至于数据集,表现方式,大家可以根据我给出的代码继续调整即可!那么,在线性回归学习中,以下10种图表是很重要的:散点图线性趋势线图残差图(Residual plot)正态概率图学习曲线方差-偏差权衡图残差对预测值图部分回归图杠杆图Cook's 距离图。

2024-05-31 08:16:27 1042

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除