算法金-CSDN博客

原创算法金 | 秒懂 AI - 深度学习五大模型：RNN、CNN、Transformer、BERT、GPT 简介

每个节点不仅接收当前输入，还接收前一个节点的输出，从而形成记忆能力。Transformer 摒弃了传统 RNN 的循环结构，通过自注意力机制和并行处理，实现了更快的训练速度和更好的效果。BERT 的创新在于其双向性和预训练方法，使得模型在各种 NLP 任务中都表现优异，尤其是在需要上下文理解的任务中。CNN 的创新点在于卷积层的使用，使其能够有效提取图像的空间特征，大大减少了参数数量，提高了计算效率。GPT 的创新在于其生成能力和规模，通过预训练和大规模数据，能够生成自然流畅的文本，几乎达到人类水平。

2024-07-15 22:57:10 1498

原创算法金 | 最难的来了：超参数网格搜索、贝叶斯优化、遗传算法、模型特异化、Hyperopt、Optuna、异步并行优化

大侠幸会，在下全网同名「算法金」 0 基础转 AI 上岸，多个算法赛 Top 「日更万日，让更多人享受智能乐趣」

2024-07-09 23:34:37 2292

原创资深博导：我以为数据预处理是常识，直到遇到自己的学生

大侠幸会，在下全网同名「算法金」 0 基础转 AI 上岸，多个算法赛 Top 「日更万日，让更多人享受智能乐趣」在光谱学领域，数据预处理是不可或缺的一环。本文将基于 NIR soil 近红外光谱数据，运用 Python 语言进行数据处理，并通过图表直观反映预处理带来的变化。（数据集：后台回复 [ NIR soil ] 获取）

2024-06-26 23:49:05 842

原创算法金 | 10 大必知的人工智能算法

定义：线性回归是一种用于预测与分析的统计学方法，旨在研究两个或多个变量之间线性关系的强度。在简单线性回归中，我们关注的是一个自变量和一个因变量之间的线性关系；而在多元线性回归中，会涉及两个或两个以上的自变量。应用场景：广泛应用于经济学、生物统计、环境科学等领域，比如预测房价、股票价格、气温变化等。1.2 原理：最小二乘法基本思想：线性回归通过最小化误差的平方和来寻找数据集中最佳拟合直线。简单来说，就是尽量让所有的数据点到直线的距离（即误差）的总和达到最小。

2024-06-02 15:40:21 1892

原创算法金 | 10 大顶流聚类算法

大侠幸会，在下全网同名「算法金」0 基础转 AI 上岸，多个算法赛 Top「日更万日，让更多人享受智能乐趣」在众多数据挖掘技术中，聚类算法（Clustering Algorithms）扮演着至关重要的角色。它帮助我们理解数据的内在结构，特别是在没有明确标签的数据集中，聚类算法可以让我们发现数据的自然分组，从而获得深刻的洞见。

2024-05-30 20:45:00 3613

原创算法金 | 吴恩达：机器学习的六个核心算法！

大侠幸会，在下全网同名「算法金」0 基础转 AI 上岸，多个算法赛 Top「日更万日，让更多人享受智能乐趣」人工智能领域的权威吴恩达教授，在其创立的《The Batch》周报中发表了一篇博文，概述了机器学习领域六种基础算法的历史和重要性。他强调了在这一领域不断学习和更新知识的必要性。这些算法包括线性回归、逻辑回归、梯度下降、神经网络、决策树和k均值聚类算法，它们是机器学习进步的基石。本文将进一步探讨这些算法的背景、原理、优缺点及应用场景。

2024-05-28 21:43:05 1564 1

原创算法金 | 这绝对是不一样的，独一无二的逻辑回归算法体验

大侠幸会，在下全网同名「算法金」 0 基础转 AI 上岸，多个算法赛 Top 「日更万日，让更多人享受智能乐趣」

2024-07-16 23:44:34 519

原创算法金 | 深度学习图像增强方法总结

常见的方法包括基于插值的方法、基于学习的方法和基于稀疏表示的方法。GAN 的基本架构由生成器和判别器组成，生成器生成假图像，判别器判断图像的真假，二者通过对抗训练不断提升图像质量。低频增强滤波通过保留图像中的低频成分（即平滑部分）来减少图像的噪声和不必要的细节。常见的方法包括基于纹理合成的方法和基于深度学习的方法。锐化滤波通过增强图像的边缘信息来提高图像的清晰度，常见的锐化滤波器有拉普拉斯滤波器和高通滤波器。基于深度学习的方法如生成对抗网络（GAN），通过生成器和判别器的对抗训练，实现图像的修复。

2024-07-14 23:04:49 675

原创回归求助 & 教程分享

大侠幸会，在下全网同名「算法金」 0 基础转 AI 上岸，多个算法赛 Top 「日更万日，让更多人享受智能乐趣」

2024-07-13 23:51:53 912

原创算法金 | 来了，pandas 2.0

大侠幸会，在下全网同名「算法金」 0 基础转 AI 上岸，多个算法赛 Top 「日更万日，让更多人享受智能乐趣」

2024-07-11 23:17:04 1004

原创算法金 | DL 骚操作扫盲，神经网络设计与选择、参数初始化与优化、学习率调整与正则化、Loss Function、Bad Gradient

大侠幸会，在下全网同名「算法金」 0 基础转 AI 上岸，多个算法赛 Top 「日更万日，让更多人享受智能乐趣」

2024-07-10 23:39:54 1039

原创算法金 | 12 个最佳 Python 代码片段，帮我完成工作自动化，香~

大侠幸会幸会，我是日更万日算法金；0 基础跨行转算法，国内外多个算法比赛 Top；放弃 BAT Offer，成功上岸 AI 研究院 Leader；Python是一种多功能的编程语言，它提供了各种功能和库来有效地自动化任务。在这篇文章中，我们将探索12个高级Python代码片段，可以自动化酷炫且有用的任务，帮助节省宝贵的时间和精力。这些代码片段将使您能够无缝完成任务，从自动化发送带附件的电子邮件到检索Wi-Fi密码、下载油管视频等等。让我们一起深入了解使用Python进行自动化！上篇 1-6。

2024-07-10 00:20:49 564

原创算法金 | 推导式、生成器、向量化、map、filter、reduce、itertools，再见 for 循环

大侠幸会，在下全网同名「算法金」 0 基础转 AI 上岸，多个算法赛 Top 「日更万日，让更多人享受智能乐趣」

2024-07-07 23:16:38 902

原创算法金 | 一个强大的算法模型，GPR ！！

GPR 的定义高斯过程回归（Gaussian Process Regression, GPR）是一种基于高斯过程的统计模型，用于处理回归问题。高斯过程是一种分布，每个样本点都遵循一个高斯分布，这使得 GPR 在处理数据的非线性关系时表现出色。GPR 的核心是利用高斯过程的性质，通过指定合适的核函数，对数据进行建模和预测。核心思想和原理GPR 的核心思想是通过高斯过程来描述输入数据的潜在函数，即假设数据来自一个多变量正态分布。核函数是 GPR 的关键，它决定了模型的平滑度、周期性等特性。

2024-07-06 23:49:58 1001

原创算法金 | 一个强大的算法模型，GPR ！！

GPR 的定义高斯过程回归（Gaussian Process Regression, GPR）是一种基于高斯过程的统计模型，用于处理回归问题。高斯过程是一种分布，每个样本点都遵循一个高斯分布，这使得 GPR 在处理数据的非线性关系时表现出色。GPR 的核心是利用高斯过程的性质，通过指定合适的核函数，对数据进行建模和预测。核心思想和原理GPR 的核心思想是通过高斯过程来描述输入数据的潜在函数，即假设数据来自一个多变量正态分布。核函数是 GPR 的关键，它决定了模型的平滑度、周期性等特性。

2024-07-06 23:48:26 1016

原创算法金 | 平均数、众数、中位数、极差、方差，标准差、频数、频率一“统”江湖

平均数，江湖人称“均值”，是一帮数字里的“老大”，它把一伙数字的总和给分了，分给每个数字一样多。就像是帮派里的老大，把抢来的金银财宝平均分给手下的兄弟们。众数，就是一帮数字里最“招人喜欢”的那个，出现次数最多的数字。好比在江湖里，最有名的大侠，被提及的次数最多。中位数，江湖上称之为“中间值”，就是一帮数字排成一列，站在队伍最中间的那个数字。如果数字的个数是奇数，那中间那个就是中位数；如果是偶数，那就取中间两个数字的平均数作为中位数。

2024-07-05 23:41:55 908

原创算法金 | 我最常用的两个数据可视化软件，强烈推荐

大侠幸会，在下全网同名「算法金」 0 基础转 AI 上岸，多个算法赛 Top 「日更万日，让更多人享受智能乐趣」预警：今天文章的描述可能会让你有点别扭；如感到不适，请及时停止在我行走江湖的行囊中，有两件利器，tableau与matplotlib，它们足以让我应对各种数据可视化的较量。tableau，乃是BI领域的名门正派，其可视化之术，与PowerBI不相上下。matplotlib，则是Python江湖中的一位侠客，以编程之力，绘制图表，既精妙又实用。防失联，进免费知识星球，直达算法金 AI 实验室。

2024-07-04 23:36:07 464

原创算法金 | 致敬深度学习三巨头：不愧是腾讯，LeNet问的巨细。。。

大侠幸会，在下全网同名「算法金」 0 基础转 AI 上岸，多个算法赛 Top 「日更万日，让更多人享受智能乐趣」读者参加面试，竟然在 LeNet 这个基础算法上被吊打~LeNet 确实经典，值得好好说道说道。

2024-07-03 23:43:52 972

原创算法金 | 欧氏距离算法、余弦相似度、汉明、曼哈顿、切比雪夫、闵可夫斯基、雅卡尔指数、半正矢、Sørensen-Dice

大侠幸会，在下全网同名「算法金」 0 基础转 AI 上岸，多个算法赛 Top 「日更万日，让更多人享受智能乐趣」在算法模型构建中，我们经常需要计算样本之间的相似度，通常的做法是计算样本之间的距离。今天，一键拿下九种距离算法。走你~

2024-07-02 23:44:13 1400

原创算法金 | Transformer，一个神奇的算法模型！！

大侠幸会，在下全网同名「算法金」 0 基础转 AI 上岸，多个算法赛 Top 「日更万日，让更多人享受智能乐趣」在现代自然语言处理（NLP）领域，Transformer 模型的出现带来了革命性的变化。它极大地提升了语言模型的性能和效率，而自注意力机制是其中的核心组件。今个儿我们将通过五个阶段，逐步深入讲解自注意力机制，帮助大侠一窥其原理和应用，成功实现变身（装 X ）

2024-07-01 22:39:04 1078

原创算法金 | 线性回归：不能忽视的五个问题

线性回归是一种统计方法，用于研究因变量 𝑌 和一个或多个自变量 𝑋 之间的线性关系。最小二乘法（OLS）：线性回归通过最小化残差平方和（即观测值与预测值之间的差值的平方和）来确定最佳拟合直线。这种方法称为最小二乘法。假设前提：线性回归模型的应用依赖于一些关键假设，包括线性关系、同方差性、独立性和正态性。线性回归的本质在于通过假设因变量和自变量之间存在线性关系，并通过最小化残差平方和来确定最佳拟合模型。虽然这些假设在现实中可能并不总是严格成立，但它们提供了一个简单而有效的方法来分析和预测数据。

2024-06-30 23:53:31 757

原创算法金 | 协方差、方差、标准差、协方差矩阵

大侠幸会，在下全网同名「算法金」 0 基础转 AI 上岸，多个算法赛 Top 「日更万日，让更多人享受智能乐趣」

2024-06-29 23:23:56 1747

原创超强，必会的机器学习评估指标

大侠幸会，在下全网同名[算法金] 0 基础转 AI 上岸，多个算法赛 Top [日更万日，让更多人享受智能乐趣]构建机器学习模型的关键步骤是检查其性能，这是通过使用验证指标来完成的。选择正确的验证指标就像选择一副水晶球：它使我们能够以清晰的视野看到模型的性能。在本指南中，我们将探讨分类和回归的基本指标和有效评估模型的知识。学习何时使用每个指标、优点和缺点以及如何在 Python 中实现它们。

2024-06-28 23:42:31 774

原创算法金 | 没有思考过 Embedding，不足以谈 AI

大侠幸会，在下全网同名「算法金」 0 基础转 AI 上岸，多个算法赛 Top 「日更万日，让更多人享受智能乐趣」在当今的人工智能（AI）领域，Embedding 是一个不可或缺的概念。如果你没有深入理解过 Embedding，那么就无法真正掌握 AI 的精髓。接下来，我们将深入探讨 Embedding 的基本概念。

2024-06-27 22:14:34 1017

原创算法金 | 决策树、随机森林、bagging、boosting、Adaboost、GBDT、XGBoost 算法大全

决策树的定义：决策树是一种树形结构，其中每个节点表示一个特征的测试，每个分支表示一个测试结果，每个叶子节点表示一个类别或回归值。决策树的目标是通过一系列的特征测试，将数据分成尽可能纯的子集。决策树的原理：决策树通过递归地选择最优特征进行分割来构建。最优特征的选择通常基于某种度量标准，如信息增益、基尼指数或方差减少。每次分割都会将数据集分成更小的子集，直到满足停止条件（如达到最大深度或子集纯度）为止。集成学习是通过结合多个学习器的预测结果来提高模型性能的一种方法。

2024-06-25 23:38:36 1259

原创算法金 | 使用随机森林获取特征重要性

大侠幸会幸会，我是日更万日算法金；0 基础跨行转算法，国内外多个算法比赛 Top；放弃 BAT Offer，成功上岸 AI 研究院 Leader；随机森林是一种强大的机器学习算法，其基本原理在于通过集成多个决策树来提高整体性能。决策树是一种流程图结构，通过一系列的决策来达到最终目标。而随机森林则是通过构建许多这样的决策树，每个决策树都在某种程度上是独立的，从而提高了模型的稳健性和准确性。这种算法在各种领域都有着广泛的应用。防失联，进免费知识星球交流。

2024-06-24 23:19:05 997

原创算法金 | K-均值、层次、DBSCAN聚类方法解析

聚类分析（Clustering Analysis）是一种将数据对象分成多个簇（Cluster）的技术，使得同一簇内的对象具有较高的相似性，而不同簇之间的对象具有较大的差异性。这种方法在无监督学习（Unsupervised Learning）中广泛应用，常用于数据预处理、模式识别、图像处理和市场分析等领域通过聚类分析，可以有效地发现数据中的结构和模式，为进一步的数据分析和挖掘提供基础。例如，在市场分析中，聚类分析可以帮助企业将客户群体进行细分，从而制定更有针对性的营销策略。

2024-06-23 23:31:10 963

原创算法金 | 统计学的回归和机器学习中的回归有什么差别？

统计学中的回归：用于解释和推断变量之间的关系，假设严格，模型简单，适用于小数据集。重点在于理解数据和变量关系，模型解释性强。机器学习中的回归：用于预测和优化，假设少，模型复杂，适用于大数据集。重点在于提高模型的预测性能，模型灵活性高。

2024-06-22 22:11:26 789

原创算法金 | 奇奇怪怪的正则化

正则化是一种防止机器学习模型过拟合的技术过拟合是指模型在训练数据上表现良好，但在新数据上表现不佳。这会导致模型无法准确预测未知数据，从而降低模型的实用性通过添加额外的约束或惩罚项，正则化限制了模型的复杂度，使其在训练数据和未知数据上表现更一致例如，当我们使用线性回归模型时，正则化可以通过限制回归系数的大小，防止模型对训练数据的噪声过于敏感。

2024-06-21 23:22:50 890

原创审稿人：拜托，请把模型时间序列去趋势！！

1.1 时间序列的定义时间序列是按照时间顺序记录的一系列数据点。常见的时间序列数据包括股票价格、温度记录、经济指标等。这些数据具有时间相关性，即前后数据点之间存在一定的依赖关系1.2 趋势的定义与分类趋势是时间序列数据中的一种长期变化模式。趋势可以是线性的，也可以是非线性的。上升趋势：数据点随时间增加而上升下降趋势：数据点随时间增加而下降平稳趋势：数据点随时间变化较小，保持稳定1.3 去趋势的基本概念去趋势是指从时间序列数据中去除长期趋势成分，使得数据更加平稳和易于分析。

2024-06-20 22:58:43 1368

原创算法金 | 再见！！！梯度下降（多图）

梯度下降优化算法的概述，目的在于帮助读者理解不同算法的优缺点梯度下降优化算法是机器学习和深度学习中最常用的优化算法之一。它通过不断调整模型参数，使得损失函数的值逐渐减小，从而使模型逐步逼近最优解梯度下降法是机器学习和深度学习中最基础和常用的优化算法之一。通过不断调整模型参数，使得损失函数的值逐渐减小，梯度下降法能够帮助模型逐步逼近最优解。根据数据集和具体应用场景的不同，可以选择不同形式的梯度下降法，如批梯度下降法、随机梯度下降法和小批量梯度下降法。1. 批梯度下降法使用整个数据集计算梯度。

2024-06-19 22:53:09 1330

原创算法金 | 一个强大的算法模型：t-SNE ！！

t-SNE 是一种非线性降维技术，用于将高维数据映射到低维空间，以便进行可视化。它通过保持高维空间中数据点之间的局部相似性来生成低维空间的表示。这种方法特别适用于揭示复杂数据集中的模式和结构。

2024-06-18 23:07:50 1764

原创李沐：用随机梯度下降来优化人生！

大侠幸会，在下全网同名「算法金」0 基础转 AI 上岸，多个算法赛 Top「日更万日，让更多人享受智能乐趣」今天我们来聊聊达叔 6 大核心算法之 —— 优化算法。梯度下降优化算法是机器学习和深度学习中最常用的优化算法之一。它通过不断调整模型参数，使得损失函数的值逐渐减小，从而使模型逐步逼近最优解梯度下降优化算法的优点梯度下降优化算法的缺点梯度下降算法的改进为了克服上述缺点，研究人员提出了多种改进算法，如动量法、Adagrad、Adam等。这些改进算法在加速收敛、避免局部最优等方面有显著效果。

2024-06-17 22:53:31 1254

原创算法金 | 一文看懂人工智能、机器学习、深度学习是什么、有什么区别！

人工智能（AI），简而言之，是让机器模仿人类的认知功能，如学习、解决问题和理解语言的科学和工程。AI旨在创造出能够执行任务且在某些情况下甚至超越人类能力的智能系统。机器学习是AI的一个分支，它允许软件应用程序变得更加精确地预测结果而无需显式编程。通过分析数据和识别模式，机器学习算法可以学习其执行任务的指令。2.1.1 从数据中学习的算法机器学习算法通过训练过程从提供的数据集中学习，并根据学习到的数据模式做出决策或预测。2.1.2 与传统编程的区别在传统编程中，程序员编写规则来处理数据并产生输出。

2024-06-16 16:36:38 910

原创算法金 | 选择最佳机器学习模型的 10 步指南

在开启任何机器学习或数据科学项目的旅程前，明确项目的目标是至关重要的第一步。这个过程就像是定下你武学修行的目的，无论是为了自我提升、护村防敌还是挑战江湖榜首，清晰的目标将指引你的学习方向和进步。

2024-06-15 22:47:05 1042

原创算法金 | 再见！！！K-means

什么是 k-means 算法k-means 算法是一种用于聚类分析的非监督学习算法。它通过将数据点划分为 k 个簇，使得每个簇中的数据点尽可能相似，而不同簇之间的数据点尽可能不同。这个算法的名称来源于其中的 k 个簇（clusters）和每个簇的均值（mean）。k-means 算法的工作原理初始化中心点分配样本到最近的中心点更新中心点迭代直到收敛下面我们来浅浅的感受一下，走你~

2024-06-14 21:39:18 970

原创算法金 | 一个强大的算法模型，GP ！！

大侠幸会，在下全网同名「算法金」 0 基础转 AI 上岸，多个算法赛 Top 「日更万日，让更多人享受智能乐趣」高斯过程算法是一种强大的非参数机器学习方法，广泛应用于回归、分类和优化等任务中。其核心思想是利用高斯分布来描述数据的分布，通过核函数来度量数据之间的相似性。与传统的机器学习方法相比，高斯过程在处理小样本数据和不确定性估计方面具有独特的优势。接下来，我们将详细探讨高斯过程的基本原理、数学表述及其在机器学习中的应用，并提供相关的代码示范和实际案例分析。

2024-06-13 22:52:51 789

原创深度学习最常用的 10 大激活函数数学原理及优缺点

激活函数（Activation Function）是一种添加到人工神经网络中的函数，旨在帮助网络学习数据中的复杂模式，是确定神经网络输出的数学方程式激活函数是神经网络模型重要的组成部分，俺们从激活函数的数学原理出发，详解激活函数的优缺点。文末总结处，看闻[激]起舞；Sigmoid函数是一种常用的激活函数，其数学形式为：它将输入的实数映射到(0,1)之间，常用于输出层的二分类问题，可以将神经网络的输出解释为概率。1.2 手动实现并可视化。

2024-06-12 23:59:44 793

原创算法金 | 一个强大的算法模型，多项式回归！！

多项式回归是对线性回归的一种扩展，它通过添加多项式项来拟合数据中的非线性关系。其基本思想是将原始特征扩展为多项式特征，然后应用线性回归模型。

2024-06-12 21:00:00 1123

原创算法金 | D3blocks，一个超酷的 Python 库

大侠幸会，在下全网同名[算法金] 0 基础转 AI 上岸，多个算法赛 Top [日更万日，让更多人享受智能乐趣]

2024-06-11 22:00:00 1050

空空如也

空空如也