![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
文章平均质量分 91
算法金
资料在 算法金 公众号领 | 【算法金】 0 基础跨行转 AI 上岸,多个算法赛 Top;多次受邀为 211 高校 AI 实训 | 日更万日,让更多人享受智能乐趣
展开
-
回归求助 & 教程分享
大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」原创 2024-07-13 23:51:53 · 841 阅读 · 0 评论 -
算法金 | 推导式、生成器、向量化、map、filter、reduce、itertools,再见 for 循环
大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」原创 2024-07-07 23:16:38 · 828 阅读 · 0 评论 -
算法金 | 一个强大的算法模型,GPR !!
GPR 的定义高斯过程回归(Gaussian Process Regression, GPR)是一种基于高斯过程的统计模型,用于处理回归问题。高斯过程是一种分布,每个样本点都遵循一个高斯分布,这使得 GPR 在处理数据的非线性关系时表现出色。GPR 的核心是利用高斯过程的性质,通过指定合适的核函数,对数据进行建模和预测。核心思想和原理GPR 的核心思想是通过高斯过程来描述输入数据的潜在函数,即假设数据来自一个多变量正态分布。核函数是 GPR 的关键,它决定了模型的平滑度、周期性等特性。原创 2024-07-06 23:49:58 · 872 阅读 · 0 评论 -
算法金 | 平均数、众数、中位数、极差、方差,标准差、频数、频率 一“统”江湖
平均数,江湖人称“均值”,是一帮数字里的“老大”,它把一伙数字的总和给分了,分给每个数字一样多。就像是帮派里的老大,把抢来的金银财宝平均分给手下的兄弟们。众数,就是一帮数字里最“招人喜欢”的那个,出现次数最多的数字。好比在江湖里,最有名的大侠,被提及的次数最多。中位数,江湖上称之为“中间值”,就是一帮数字排成一列,站在队伍最中间的那个数字。如果数字的个数是奇数,那中间那个就是中位数;如果是偶数,那就取中间两个数字的平均数作为中位数。原创 2024-07-05 23:41:55 · 656 阅读 · 0 评论 -
算法金 | 我最常用的两个数据可视化软件,强烈推荐
大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」预警:今天文章的描述可能会让你有点别扭;如感到不适,请及时停止在我行走江湖的行囊中,有两件利器,tableau与matplotlib,它们足以让我应对各种数据可视化的较量。tableau,乃是BI领域的名门正派,其可视化之术,与PowerBI不相上下。matplotlib,则是Python江湖中的一位侠客,以编程之力,绘制图表,既精妙又实用。防失联,进免费知识星球,直达算法金 AI 实验室。原创 2024-07-04 23:36:07 · 392 阅读 · 0 评论 -
算法金 | 欧氏距离算法、余弦相似度、汉明、曼哈顿、切比雪夫、闵可夫斯基、雅卡尔指数、半正矢、Sørensen-Dice
大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」在算法模型构建中,我们经常需要计算样本之间的相似度,通常的做法是计算样本之间的距离。今天,一键拿下九种距离算法。走你~原创 2024-07-02 23:44:13 · 695 阅读 · 0 评论 -
算法金 | 线性回归:不能忽视的五个问题
线性回归是一种统计方法,用于研究因变量 𝑌 和一个或多个自变量 𝑋 之间的线性关系。最小二乘法(OLS):线性回归通过最小化残差平方和(即观测值与预测值之间的差值的平方和)来确定最佳拟合直线。这种方法称为最小二乘法。假设前提:线性回归模型的应用依赖于一些关键假设,包括线性关系、同方差性、独立性和正态性。线性回归的本质在于通过假设因变量和自变量之间存在线性关系,并通过最小化残差平方和来确定最佳拟合模型。虽然这些假设在现实中可能并不总是严格成立,但它们提供了一个简单而有效的方法来分析和预测数据。原创 2024-06-30 23:53:31 · 644 阅读 · 0 评论 -
算法金 | 协方差、方差、标准差、协方差矩阵
大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」原创 2024-06-29 23:23:56 · 683 阅读 · 0 评论 -
资深博导:我以为数据预处理是常识,直到遇到自己的学生
大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」在光谱学领域,数据预处理是不可或缺的一环。本文将基于 NIR soil 近红外光谱数据,运用 Python 语言进行数据处理,并通过图表直观反映预处理带来的变化。(数据集:后台回复 [ NIR soil ] 获取 )原创 2024-06-26 23:49:05 · 606 阅读 · 0 评论 -
算法金 | K-均值、层次、DBSCAN聚类方法解析
聚类分析(Clustering Analysis)是一种将数据对象分成多个簇(Cluster)的技术,使得同一簇内的对象具有较高的相似性,而不同簇之间的对象具有较大的差异性。这种方法在无监督学习(Unsupervised Learning)中广泛应用,常用于数据预处理、模式识别、图像处理和市场分析等领域通过聚类分析,可以有效地发现数据中的结构和模式,为进一步的数据分析和挖掘提供基础。例如,在市场分析中,聚类分析可以帮助企业将客户群体进行细分,从而制定更有针对性的营销策略。原创 2024-06-23 23:31:10 · 868 阅读 · 0 评论 -
算法金 | 统计学的回归和机器学习中的回归有什么差别?
统计学中的回归:用于解释和推断变量之间的关系,假设严格,模型简单,适用于小数据集。重点在于理解数据和变量关系,模型解释性强。机器学习中的回归:用于预测和优化,假设少,模型复杂,适用于大数据集。重点在于提高模型的预测性能,模型灵活性高。原创 2024-06-22 22:11:26 · 661 阅读 · 0 评论 -
审稿人:拜托,请把模型时间序列去趋势!!
1.1 时间序列的定义时间序列是按照时间顺序记录的一系列数据点。常见的时间序列数据包括股票价格、温度记录、经济指标等。这些数据具有时间相关性,即前后数据点之间存在一定的依赖关系1.2 趋势的定义与分类趋势是时间序列数据中的一种长期变化模式。趋势可以是线性的,也可以是非线性的。上升趋势:数据点随时间增加而上升下降趋势:数据点随时间增加而下降平稳趋势:数据点随时间变化较小,保持稳定1.3 去趋势的基本概念去趋势是指从时间序列数据中去除长期趋势成分,使得数据更加平稳和易于分析。原创 2024-06-20 22:58:43 · 989 阅读 · 0 评论 -
算法金 | 再见!!!K-means
什么是 k-means 算法k-means 算法是一种用于聚类分析的非监督学习算法。它通过将数据点划分为 k 个簇,使得每个簇中的数据点尽可能相似,而不同簇之间的数据点尽可能不同。这个算法的名称来源于其中的 k 个簇(clusters)和每个簇的均值(mean)。k-means 算法的工作原理初始化中心点分配样本到最近的中心点更新中心点迭代直到收敛下面我们来浅浅的感受一下,走你~原创 2024-06-14 21:39:18 · 885 阅读 · 0 评论 -
算法金 | 一个强大的算法模型,GP !!
大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」高斯过程算法是一种强大的非参数机器学习方法,广泛应用于回归、分类和优化等任务中。其核心思想是利用高斯分布来描述数据的分布,通过核函数来度量数据之间的相似性。与传统的机器学习方法相比,高斯过程在处理小样本数据和不确定性估计方面具有独特的优势。接下来,我们将详细探讨高斯过程的基本原理、数学表述及其在机器学习中的应用,并提供相关的代码示范和实际案例分析。原创 2024-06-13 22:52:51 · 614 阅读 · 0 评论 -
深度学习最常用的 10 大激活函数数学原理及优缺点
激活函数(Activation Function)是一种添加到人工神经网络中的函数,旨在帮助网络学习数据中的复杂模式,是确定神经网络输出的数学方程式激活函数是神经网络模型重要的组成部分,俺们从激活函数的数学原理出发,详解激活函数的优缺点。文末总结处,看闻[激]起舞;Sigmoid函数是一种常用的激活函数,其数学形式为:它将输入的实数映射到(0,1)之间,常用于输出层的二分类问题,可以将神经网络的输出解释为概率。1.2 手动实现并可视化。原创 2024-06-12 23:59:44 · 585 阅读 · 0 评论 -
算法金 | 一个强大的算法模型,多项式回归!!
多项式回归是对线性回归的一种扩展,它通过添加多项式项来拟合数据中的非线性关系。其基本思想是将原始特征扩展为多项式特征,然后应用线性回归模型。原创 2024-06-12 21:00:00 · 839 阅读 · 0 评论 -
算法金 | 一文彻底理解机器学习 ROC-AUC 指标
ROC 曲线,即接收者操作特征曲线,ROC曲线产生于第二次世界大战期间,最早用在信号检测领域,侦测战场上的敌军载具(飞机、船舰)。现在是是用来评价二分类模型性能的常用图形工具。它通过显示真阳性率(True Positive Rate,简称 TPR)与假阳性率(False Positive Rate,简称 FPR)之间的权衡来帮助我们理解模型的分类能力。AUC,即曲线下面积(Area Under Curve),是 ROC 曲线下面积的一个数值表示。它提供了一个定量的指标,用来衡量分类模型的整体表现。原创 2024-06-11 21:00:00 · 1135 阅读 · 0 评论 -
算法金 | A - Z,115 个数据科学 机器学习 江湖黑话(全面)
大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」机器学习本质上和数据科学一样都是依赖概率统计,今天整整那些听起来让人头大的机器学习江湖黑话。原创 2024-06-10 16:20:28 · 806 阅读 · 0 评论 -
算法金 | 让数据讲故事:数据可视化的艺术与科学,几乎是每个领域都需要掌握的技能
大侠幸会,在下全网同名[算法金] 0 基础转 AI 上岸,多个算法赛 Top [日更万日,让更多人享受智能乐趣]原创 2024-06-08 23:35:43 · 981 阅读 · 0 评论