自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

CKissjy的博客

原创 ❤七万字精华大合集！三年沉淀：从Python脚本到深度模型——构建数据科学全栈硬核知识体系。❤

在过去整整三年的时光里，我全身心地投入到学习与探索之中，将无数个日夜的钻研、思考与实践，凝结成了这篇博客。这篇总结犹如一座知识宝库，涵盖了Python、机器学习、深度学习等众多领域的精华内容。从20个硬核Python脚本，到机器学习中10种损失函数的全面梳理；从正则化算法、集成算法的总结，到聚类算法、SVM算法的深度剖析；从逻辑回归面试题的干货分享，到深度学习各算法优缺点及适用场景的探讨，再到Matplotlib的实用总结以及30个硬核数据集的呈现。每一个章节都倾注了我大量的心血，每一行文字都饱含着我对

2025-06-15 19:08:16 2040 1

原创机器学习过拟合和欠拟合

今天介绍了过拟合和欠拟合，以及代码案例，并且给出的解决方案。喜欢的朋友可以起来！

2025-06-14 22:13:37 877

原创机器学习过拟合和欠拟合（上）

今天介绍了过拟合和欠拟合，以及代码案例，并且给出的解决方案。喜欢的朋友可以起来！

2025-06-14 22:12:16 900

原创搞懂欠拟合VS过拟合（下）

今天介绍了过拟合和欠拟合，以及代码案例，并且给出的解决方案。喜欢的朋友可以起来！

2025-06-14 22:11:24 779

原创模型翻车元凶解剖：一文彻底搞懂欠拟合VS过拟合

今天介绍了过拟合和欠拟合，以及代码案例，并且给出的解决方案。喜欢的朋友可以起来！

2025-06-12 21:44:34 1176

原创模型翻车元凶解剖：一文彻底搞懂欠拟合VS过拟合（下）

今天介绍了过拟合和欠拟合，以及代码案例，并且给出的解决方案。喜欢的朋友可以起来！

2025-06-12 21:43:53 621

原创《Python脚本炼金术：从数据清洗到AI模型，解锁高效开发秘籍》下

另外，每个模块底部提供了对于官网文档，更加方便的查询具体的使用方法。内容由简到难，如果对你有帮助的话希望。

2025-06-10 23:13:35 897

原创《Python脚本炼金术：从数据清洗到AI模型，解锁高效开发秘籍》

另外，每个模块底部提供了对于官网文档，更加方便的查询具体的使用方法。内容由简到难，如果对你有帮助的话希望。

2025-06-10 23:13:22 1108

原创线性回归可视化完全手册：10张关键图表助你深入理解模型（下）

至于数据集，表现方式，大家可以根据我给出的代码继续调整即可！那么，在线性回归学习中，以下10种图表是很重要的：散点图线性趋势线图残差图（Residual plot）正态概率图学习曲线方差-偏差权衡图残差对预测值图部分回归图杠杆图Cook's 距离图。

2025-06-08 16:42:42 1179

原创线性回归可视化完全手册：10张关键图表助你深入理解模型

至于数据集，表现方式，大家可以根据我给出的代码继续调整即可！那么，在线性回归学习中，以下10种图表是很重要的：散点图线性趋势线图残差图（Residual plot）正态概率图学习曲线方差-偏差权衡图残差对预测值图部分回归图杠杆图Cook's 距离图。

2025-06-08 16:41:31 1027

原创深度学习算法大观园：从自编码器到强化学习，优缺点与实战场景全解析❤

今天演示了深度学习各分支算法的优缺点和适用场景！喜欢的朋友可以。

2025-06-07 22:05:18 927

原创快进来学IT届的特征炼金术：从数据废墟中提取模型黄金（下）

好的特征能够提高模型的性能。通过特征工程，可以处理缺失值、异常值以及数据不一致性等问题，从而提升数据的质量和可用性。特征工程直接影响了模型的性能。合适的特征选择可以提高模型的泛化能力，减少过拟合的风险；合适的特征转换和标准化可以提高模型的稳定性和收敛速度。在高维数据中，模型容易受到维度灾难的影响，即数据稀疏性增加、计算复杂度增加、模型泛化能力下降等。通过特征选择、降维等手段，可以缓解维度灾难带来的问题。特征工程是将领域知识融入到模型中的重要途径。

2025-06-06 14:57:29 734

原创快进来学IT届的特征炼金术：从数据废墟中提取模型黄金

好的特征能够提高模型的性能。通过特征工程，可以处理缺失值、异常值以及数据不一致性等问题，从而提升数据的质量和可用性。特征工程直接影响了模型的性能。合适的特征选择可以提高模型的泛化能力，减少过拟合的风险；合适的特征转换和标准化可以提高模型的稳定性和收敛速度。在高维数据中，模型容易受到维度灾难的影响，即数据稀疏性增加、计算复杂度增加、模型泛化能力下降等。通过特征选择、降维等手段，可以缓解维度灾难带来的问题。特征工程是将领域知识融入到模型中的重要途径。

2025-06-06 14:54:01 854

原创【高端局】组合多个弱学习器达到性能跃升的硬核集成算法

今天介绍了5个机器学习中关于集成学习的总结，包括Bagging、Boosting、Stacking、Voting、深度学习集成喜欢的朋友可以起来！

2025-03-23 12:34:41 1648

原创 sklearn库的使用【无监督学习】

无监督学习是在没有标签的数据上训练的。其主要目的可能包括聚类、降维、生成模型等。以下是，这些算法都可以通过使用sklearn。

2025-03-23 12:30:27 1139

原创【IT大学生必会的】 10 种图表线性回归

至于数据集，表现方式，大家可以根据我给出的代码继续调整即可！那么，在线性回归学习中，以下10种图表是很重要的：散点图线性趋势线图残差图（Residual plot）正态概率图学习曲线方差-偏差权衡图残差对预测值图部分回归图杠杆图Cook's 距离图。

2025-03-22 07:08:22 1242

原创【IT大学生必会】深度学习各算法的优缺点和适用场景

.

2025-03-16 11:35:10 1385

原创 ❤【纯干货】Matplotlib总结，任何项目都用得到❤

❤纯干货❤目录1、绘制基本图形2、定制化图形3、支持多个坐标轴4、3D绘图5、动态交互绘图6、绘制地图7、绘制统计图表最后在很多人眼里是无敌的存在，而且可以说是无敌的存在。走过数据科学的路，路上必然有的风景在你周围。如果同一个项目，你的用了matplotlib 不仅有基本图形、定制化图形、多个坐标轴、3D绘图，还有动态交互绘图、绘制地图、绘制统计图表，甚至还有地图分布！那么谁的更吸引人呢？收藏备用，一定用的上！是一个功能强大且广泛使用的数据可视化工具，特别适用于科学计算、数据分析和数据科学领

2025-03-16 11:31:17 1121

原创 6大部分，20 个机器学习算法全面汇总！！建议收藏！（上篇）

它的基本原理是根据数据的特征来构建一颗树状结构，树的每个节点代表一个特征，每个分支代表一个特征的取值，叶节点代表输出类别或数值。对于回归问题，KNN计算最近的K个训练样本的数值输出的平均值或加权平均值，并将结果用作待预测样本的输出。例如，单链接合并规则下，两个簇之间的距离通常是两个簇内距离最近的数据点之间的距离。K 均值聚类（K-Means Clustering）是一种常见的无监督学习算法，用于将数据集划分为K个不同的簇（cluster），使得每个数据点属于距离其最近的簇的中心点。

2025-03-15 18:32:22 1193

原创 6大部分，20 个机器学习算法全面汇总！！建议收藏！（下篇）

好了，朋友们，上面咱们列举的 20 个机器学习的核心原理和思路，算是有效的帮助大家做了一个总结！每种算法都有其自身的优点和适用领域，选择算法取决于任务的性质和数据的特点。喜欢的朋友可以起来！

2025-03-15 18:32:02 673

原创【大一新生必收藏系列】❤机器学习7大方面，30个数据集。纯干货分享❤

选择适当的数据集、数据清洗、特征工程和数据预处理等步骤都需要谨慎处理，以确保模型能够在实际应用中取得良好的效果。数据集的质量和数量都是决定模型成功的关键要素。数据集的大小和质量可以影响模型的过拟合和欠拟合情况。一个好的数据集可以让模型更准确，而低质量或小规模的数据集可能导致模型表现不佳。的30个常见机器学习数据集，以及每个数据集的介绍、获取链接和可能涉及到的算法。好的数据集能够确保模型在不同数据上的泛化能力。合适的特征选择和工程能够提高模型的泛化能力。数据集的不平衡分布或偏斜可能导致模型的偏差。

2025-03-14 15:40:17 1127

原创入门程序员必会的SVM算法，大一时候这个算法帮忙完成了超级多项目

另外，非线性SVM的数学公式比较复杂，但我们可以简化为：它是一种方法，可以将数据映射到一个不同的空间，然后在那个空间中使用线性SVM。我们还有k个类别，用1到k的数字表示。它的目标是找到一个能够在数据中画出一条直线（或者高维空间中的超平面），将不同类别的数据点分隔开，并且最大化两侧最靠近这条线的数据点之间的距离。：SVM支持向量机对于训练数据中的噪声和异常点具有一定的鲁棒性，可以有效地处理输入数据中的噪声。核贝叶斯支持向量机通过学习一些已知的例子，并找到一个特殊的边界，用于将不同的事物区分开来。

2025-03-13 11:18:15 1100

原创【大一新生必看】机器学习过拟合和欠拟合！看这一篇文章就够了

今天介绍了过拟合和欠拟合，以及代码案例，并且给出的解决方案。喜欢的朋友可以起来！

2025-03-13 11:15:55 1366

原创【大梳理】机器学习中10种损失函数大梳理！建议收藏 1、均方误差2、平均绝对误差3、交叉熵损失4、对数损失5、多类别交叉熵损失6、二分类交叉熵损失7、余弦相似度损失 8、希尔

是在机器学习和深度学习中用来衡量模型预测值与真实标签之间差异的函数。不同的任务和模型可能需要不同的损失函数。今天就聊聊下面常见的损失函数，关于原理、使用场景，并且给出完整的代码：均方误差平均绝对误差交叉熵损失对数损失多类别交叉熵损失二分类交叉熵损失余弦相似度损失希尔伯特-施密特口袋Huber损失感知器损失ok，咱们一起来学习一下~

2025-03-09 21:09:29 1845

原创 15个硬核机器学习库。【耗时十小时整理】❤

今天就从每种 Python 库的。

2025-03-09 21:08:19 949

原创 ❤简单但是很常用的线性回归 10 种图表❤o(￣▽￣)ブ

至于数据集，表现方式，大家可以根据我给出的代码继续调整即可！那么，在线性回归学习中，以下10种图表是很重要的：散点图线性趋势线图残差图（Residual plot）正态概率图学习曲线方差-偏差权衡图残差对预测值图部分回归图杠杆图Cook's 距离图。

2025-03-08 11:43:51 1281

原创机器学习：在Python中sklearn库的使用，纯干货！12个小时的整理！

无监督学习是在没有标签的数据上训练的。其主要目的可能包括聚类、降维、生成模型等。以下是，这些算法都可以通过使用sklearn。

2025-03-03 08:21:14 1021

原创【建议收藏】20个硬核Python脚本，纯干货分享

另外，每个模块底部提供了对于官网文档，更加方便的查询具体的使用方法。内容由简到难，如果对你有帮助的话希望。

2025-03-01 08:09:33 559

原创机器学习干货笔记分享：朴素贝叶斯算法

朴素贝叶斯分类是一种十分简单的分类算法，即对于给出的待分类项，求解在此项出现的条件下各个类别出现的概率，哪个最大，就认为此待分类项属于哪个类别。以判定外国友人为例做一个形象的比喻。若我们走在街上看到一个黑皮肤的外国友人，让你来猜这位外国友人来自哪里。十有八九你会猜是从非洲来的，因为黑皮肤人种中非洲人的占比最多，虽然黑皮肤的外国人也有可能是美洲人或者是亚洲人。但是在没有其它可用信息帮助我们判断的情况下，我们会选择可能出现的概率最高的类别，这就是朴素贝叶斯的基本思想。

2024-12-11 13:38:43 560

原创机器学习干货笔记分享：k近邻（knn）算法

重难点：机器学习算法的基本概念和适用场景。英国统计学家George E. P. Box的名言：All models are wrong, but some are useful. 没有哪一种算法能够适用所有情况，只有针对某一种问题更有用的算法。也就是说，机器学习算法不会要求一个问题被 100%求解，取而代之的是把问题转化为最优化的问题，用不同的算法优化问题，从而比较得到尽量好的结果。因此对于数据科学家来说，理解算法显得格外重要，理解不同算法的思想可以帮助数据科学家更从容地面对不同的应用场景。

2024-12-11 13:34:55 896

原创【耗时八个小时】机器学习过拟合和欠拟合！看这一篇文章就够了

.

2024-06-25 08:53:20 1100 1

原创程序员最趁手的SVM算法，学完你会哭着感谢努力的自己！

另外，非线性SVM的数学公式比较复杂，但我们可以简化为：它是一种方法，可以将数据映射到一个不同的空间，然后在那个空间中使用线性SVM。我们还有k个类别，用1到k的数字表示。它的目标是找到一个能够在数据中画出一条直线（或者高维空间中的超平面），将不同类别的数据点分隔开，并且最大化两侧最靠近这条线的数据点之间的距离。：SVM支持向量机对于训练数据中的噪声和异常点具有一定的鲁棒性，可以有效地处理输入数据中的噪声。核贝叶斯支持向量机通过学习一些已知的例子，并找到一个特殊的边界，用于将不同的事物区分开来。

2024-06-25 08:52:02 1064

原创 ❤【纯干货】Matplotlib总结，任何项目都用得到❤

❤纯干货❤目录1、绘制基本图形2、定制化图形3、支持多个坐标轴4、3D绘图5、动态交互绘图6、绘制地图7、绘制统计图表最后在很多人眼里是无敌的存在，而且可以说是无敌的存在。走过数据科学的路，路上必然有的风景在你周围。如果同一个项目，你的用了matplotlib 不仅有基本图形、定制化图形、多个坐标轴、3D绘图，还有动态交互绘图、绘制地图、绘制统计图表，甚至还有地图分布！那么谁的更吸引人呢？收藏备用，一定用的上！是一个功能强大且广泛使用的数据可视化工具，特别适用于科学计算、数据分析和数据科学领

2024-06-24 14:47:38 728

原创 ❤机器学习正则化算法的总结。耗时10个小时完成。❤

Dropout 正则化的原理是，在训练期间以概率随机地将一部分神经元的输出设置为零，称为“丢弃”。通过绘制训练误差和验证误差的曲线，以及早停法的标记点，可以更加直观地观察到模型的优化过程和选择最佳模型时的判定点。上述代码生成了一些具有噪声的样本数据，并构建了一个简单的具有Dropout正则化的神经网络模型。通过增强后的数据集，模型能够更好地捕捉到数据的不同特征和变化，使得模型能够更好地区分两个类别。通过这种方式，Dropout 正则化可以减少神经元之间的依赖性，提高模型的鲁棒性。

2024-06-24 14:45:55 627

原创机器学习各个算法的优缺点！（下篇）建议收藏。

纯干货！....直接进入主题。

2024-06-23 09:43:55 546

原创机器学习各个算法的优缺点！（上篇）建议收藏。

回归正则化算法集成算法决策树算法支持向量机降维算法聚类算法贝叶斯算法人工神经网络深度学习。

2024-06-23 09:43:41 1135

原创【建议收藏】逻辑回归面试题，机器学习干货、重点。

逻辑回归的目标函数，通常也称为损失函数或代价函数，用于衡量模型的预测与实际观测值之间的差异。逻辑回归通常用于二分类问题，其目标是最大化观测数据属于正类别或负类别的概率，从而能够进行分类。逻辑回归的目标函数通常使用交叉熵损失函数（Cross-Entropy Loss Function）或对数损失函数（Log Loss Function），这两者通常是等价的。逻辑回归的交叉熵损失函数对于二分类问题，逻辑回归的损失函数可以表示为以下形式：其中：是损失函数。是训练样本数量。

2024-06-22 08:46:28 1154

原创机器学习7大方面，30个硬核数据集。纯干货分享

选择适当的数据集、数据清洗、特征工程和数据预处理等步骤都需要谨慎处理，以确保模型能够在实际应用中取得良好的效果。数据集的质量和数量都是决定模型成功的关键要素。数据集的大小和质量可以影响模型的过拟合和欠拟合情况。一个好的数据集可以让模型更准确，而低质量或小规模的数据集可能导致模型表现不佳。的30个常见机器学习数据集，以及每个数据集的介绍、获取链接和可能涉及到的算法。好的数据集能够确保模型在不同数据上的泛化能力。合适的特征选择和工程能够提高模型的泛化能力。数据集的不平衡分布或偏斜可能导致模型的偏差。

2024-06-22 08:43:05 1098

原创深度学习各算法的优缺点和适用场景！！纯干货，建议收藏。（下篇）

纯干货。

2024-06-21 13:54:09 1157

原创深度学习各算法的优缺点和适用场景！！纯干货，建议收藏。（上篇）

纯干货深度学习通过多层神经网络模型来学习和表示数据的高级特征。。深度学习现在的重要作用是大家有目共睹的。先来简单来聊聊在算法领域和实际工业领域都发挥了哪些重要的作用。1、：深度学习可以用于解决复杂的模式识别问题，如图像分类、语音识别和自然语言处理。深度卷积神经网络和循环神经网络等模型在这些任务中取得了巨大的成功。2、：深度学习可用于生成新的数据，包括图像、文本和音频。生成对抗网络和变分自编码器等生成模型已经被广泛应用于图像生成、自然语言生成和音乐合成等任务。3、

2024-06-21 13:51:50 1109

空空如也

田忌赛马问题】，用c语言实现蛮力法实现的全排列算法”

2024-06-29

5稀疏支持向量机..

2024-06-25

6核贝叶斯支持向量机

2024-06-25

贝叶斯Ridge回归

2024-06-24

机器学习各个算法的优缺点

2024-06-23

argparse库33333

2024-06-22

命令行应用 - argparse

2024-06-21

线性回归（Linear Regression）是一种用于建立连续数值输出与一个或多个输入特征之间关系的监督学习算法。

2024-06-19

机器学习正则化算法的总结

2024-06-18

机器学习中的神经网络重难点

2024-06-17

机器学习中的神经网络重难点

2024-06-16

关于机器学习的向量机，都讲了什么

2024-06-14

关于支持向量机，他的重难点是什么？

2024-06-12

关于深度学习，有什么小窍门，更好的学习

2024-06-11

深度学习各算法的优缺点和适用场景

2024-06-08

给我讲清楚机器学习库

2024-06-07

scikit-learn有什么用？怎么用呢？什么场景下用

2024-06-05

如何更好更快速的学习完SVM算法

2024-06-04

关于机器学习，有什么更好的建议？

2024-06-03

机器学习算法中，那些属于线性回归算法（相关搜索：机器学习算法）

2024-06-02

机器学习中，卷积怎么用更好(语言-python)

2024-06-01

关于#python#的问题，请各位专家解答！

2024-05-31

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

Boss.੭ ˙ᗜ˙ ੭

博客等级

码龄4年

126
原创

3213
点赞

2216
收藏

3398
粉丝

关注

私信

热门文章

分类专栏

机器学习笔记 1篇

最新评论

❤七万字精华大合集！三年沉淀：从Python脚本到深度模型——构建数据科学全栈硬核知识体系。❤
杨利杰YJlio: ┌─────────────────────────────────────────┐ │ 💻 代码改变世界，分享创造价值 💻 │ └─────────────────────────────────────────┘ 🦄马年大吉行大运，新年快乐！🦄 🦄技术之路，与你同行 🦄 🦄马到成功┌─────────────────────────────────────────┐ │ 💻 代码改变世界，分享创造价值 💻 │ └─────────────────────────────────────────┘ 🦄马年大吉行大运，新年快乐！🦄 🦄技术之路，与你同行 🦄 🦄马到成功🦄 ============================================ 读者评论：内容详尽干货满，用心分享必须支持，期待博主更多佳作！ ============================================🦄 ============================================ 读者评论：内容详尽干货满，用心分享必须支持，期待博主更多佳作！ ============================================
线性回归 10 种图表上
Boss.੭ ˙ᗜ˙ ੭: 老玩家调库确实觉得方便，但是新手的话手动计算一下编写代码能更好的理解线性回归的数学原理
线性回归 10 种图表上
xiao助阵: linear_model.LinearRegression算坡度和截距的结果也是这样但是为什么这样算 numerator = sum((X - X_mean) * (y - y_mean)) denominator = sum((X - X_mean) ** 2) slope = numerator / denominator
程序员最趁手的SVM算法，学完你会哭着感谢努力的自己！下篇.
普通网友: 写的很好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

提示

确定要删除当前文章？

取消删除