自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(52)
  • 收藏
  • 关注

原创 【SHAP解释运用2】基于python的特征选择+XGBoost水库震级回归预测+SHAP解释预测

SHAP绝大数可视化都有,进来看看吧,代码直接复制粘贴。

2024-07-19 10:50:12 957

原创 基于python的三次样条插值原理及代码

三次样条插值通过求解一系列线性方程组来确定每个小区间上的三次多项式,这些多项式在样本点处满足插值条件,并且具有连续的一阶导数和二阶导数。自然边界条件、固定边界条件或非扭结边界条件等不同的边界条件选择会影响求解过程和最终的插值曲线形状。三次样条插值因其光滑性和易于实现的特性,在数值分析、数据可视化、计算机辅助设计等领域有着广泛的应用。

2024-07-18 12:59:56 940 2

原创 基于python的决策树分类原理与代码实例(代码直接复制粘贴)

决策树可以被视为一系列if-then规则的集合,从根节点到叶结点的每一条路径都构建了一条规则,路径上的内部结点特征对应规则的条件,叶结点的类别对应规则的结论。注意,如果某个属性A的取值数目较多,则SplitInfo(D,A)的值会较大,导致GainRatio(D,A)的值较小。其中,∣Y∣表示数据集D中不同类别的个数,pk​表示数据集D中属于第k个类别的样本占总样本数的比例。基尼系数的值越小,表示数据集D的纯度越高。给定属性A,我们可以计算条件熵H(D∣A),即在属性A的条件下,数据集D的经验条件熵。

2024-07-17 20:21:17 672

原创 [集成学习]基于python的Stacking分类模型的客户购买意愿分类预测

图8-1 Stacking分类模型结构。图3-1 缺失值可视化与重复值检测。图5-2 clustermap。图11-2 ROC曲线对比。图12-1 新数据预测结果。图5-1 heatmap。图10-1 预测结果。图11-1 混淆矩阵。

2024-07-17 12:14:57 1229 1

原创 基于LSTM及其变体的回归预测

代码中用到了以下模型:1. LSTM(Long Short-Term Memory):长短时记忆网络,是一种特殊的RNN(循环神经网络),能够解决传统RNN在处理长序列时出现的梯度消失或爆炸的问题。LSTM有门控机制,可以选择性地记住或忘记信息。2. FC-LSTM:全连接的LSTM,与传统的LSTM相比,其细胞单元之间采用全连接的方式。3. Coupled LSTM:耦合LSTM,是一种特殊的LSTM结构,其中每个LSTM单元被分解为两个交互的子单元。

2024-07-16 03:01:41 935

原创 什么是人工智能的黑盒效应

在许多情况下,AI模型被视作一个“黑盒子”,只能看到输入和输出,却无法观察其内部的逻辑和运作过程[^1^]。为了解决这些问题,许多研究者致力于揭示AI模型的内部工作机制。例如,波恩大学的Jürgen Bajorath教授及其团队通过技术手段揭示了药物研究中使用的AI系统的运行机制,发现这些模型主要依赖于回忆现有数据来预测药物的有效性,而非学习特定的化学相互作用[^2^]。**人工智能的黑盒效应是指AI模型的内部运作机制不透明,人们难以理解其如何从输入得到输出的现象**。

2024-07-14 23:59:29 453

原创 基于lstm的股票Volume预测

LSTM(Long Short-Term Memory)神经网络模型是一种特殊的循环神经网络(RNN),它在处理长期依赖关系方面表现出色,尤其适用于时间序列预测、自然语言处理(NLP)和语音识别等领域。以下是对LSTM神经网络模型的详细介绍,包括其每一部分的功能和原理。一、LSTM网络模型概述LSTM网络通过引入门控单元(Gate Control)来解决传统RNN在处理长序列时容易出现的梯度消失或梯度爆炸问题。它通过控制信息的流动,有效地保留了序列中的长期依赖信息。1.1 LSTM网络结构。

2024-07-13 13:42:10 1179

原创 基于python的随机森林回归预测+贝叶斯优化超参数前后训练效果对比

从结果上看,优化了个寂寞,这和。本身随机森林训练效果就好。

2024-07-02 22:32:13 723

原创 绘图黑系配色

随便看了几篇小论文,里面的黑配色挺喜欢的,虽然SCI系配色用的多,但看到纯黑配色与黑加蓝配色,那就是我最心上的最优style。

2024-07-01 11:04:06 165

原创 基于python的房价多元线性回归分析

VIF(变量互异性)因子分析显示,大多数变量的VIF值都在1到5之间,这意味着这些变量之间存在一定的相关性,但这种相关性相对较低。其中,'number'、'crim'、'zn'、'indus'、'chas'、'nox'、'rm'、'age'、'dis'、'rad'、'tax'、'ptratio'、'b'和'lstat'的VIF值超过了5,可能需要进一步审查以确定它们是否是共线性问题。然而,为了确保模型的准确性和泛化能力,建议对模型进行交叉验证,并检查所有显著的变量,特别是那些VIF值较高的变量。

2024-06-30 20:38:21 1114

原创 基于matlab的可乐标签模板匹配

其中,S(i,j) 是目标图像中子图像在位置 (i,j) 的像素值,T(i,j) 是模板图像在相应位置的像素值,templateHeight 和 templateWidth 分别是模板图像的高度和宽度。这个公式用于计算目标图像中每个可能位置与模板图像之间的平方差之和,以找到最佳匹配位置。通过这种方式,代码实现了基于平方差之和的模板匹配算法,用于在目标图像中找到与模板图像最匹配的位置。这里对目标图像与模板图像不再灰度化直接进行模板匹配,且矩形标记线宽进行微调。图4-2 调整模板匹配结果局部放大图。

2024-06-30 16:50:34 422

原创 基于大津阈值法和二值化与联通区域标记进行图像目标计数

3.可以使用label2rgb函数将标记图像转换为彩色图像,以便于观察不同的连通区域。2.如果图像是彩色的,通常需要先转换为灰度图像,因为大津阈值法通常应用于灰度图像。1.bwlabel函数在返回标记图像的同时,也返回了连通区域的数量。1.如果图像是彩色的,使用rgb2gray函数将其转换为灰度图像。1.使用imshow函数显示原始图像、二值化图像和标记后的图像。2.这个函数会为每个独立的连通区域分配一个唯一的标签。1.使用bwlabel函数标记二值图像中的连通区域。1.使用imread函数读取图像文件。

2024-06-30 14:29:01 364

原创 【集成学习】基于python的Stacking分类预测

学机器学习时,也是一个分类任务,别人都是单一的分类模型,我当时直接一手集成学习。

2024-06-28 10:30:23 1545

原创 mathcup大数据竞赛论文中集成学习(或模型融合)的运用分析

1.集成学习原理ps: (模型融合和集成学习是两个紧密相关但又有所区别的概念。集成学习是一种更广泛的范式,而模型融合可以被视为集成学习的一种特殊形式或策略。1.集成学习原理图1如图1所示,集成学习是一种通过结合多个机器学习模型的预测来提高整体性能的策略。其核心思想是构建多个基学习器,每个学习器解决同一问题,但各有侧重点或训练子集。这些单独的预测然后被合并,形成最终的预测结果。集成学习的优势在于它能够减少单个模型的偏差和方差,从而提高预测的准确性和鲁棒性。

2024-06-28 01:34:21 780

原创 【集成学习】基于python的stacking回归预测

Bagging是一种并行式集成学习方法,它通过自助采样法(bootstrap sampling)从原始数据集中生成多个子集,然后在每个子集上训练一个基学习器,并将这些基学习器的输出通过简单投票法或平均法等方式结合起来,形成最终的预测结果。Boosting是一种串行式集成学习方法,它通过改变训练样本的权重,使得先前学习器做错的样本在后续学习器中得到更多的关注,从而逐步提高集成学习的性能。Stacking的核心思想是通过将多个基学习器的预测结果作为新的特征,增加模型的复杂度,从而提高集成学习的性能。

2024-06-27 21:45:28 1047

原创 MATLAB2024a下的神经网络聚类工具箱聚类

如图4-1、图4-2、图4-3、图4-4所示,导入预测数据与导入训练数据系相同,熟悉了可以直接操作。如图3-1,调整验证集与测试集比例及映射大小后点击”训练“,开始训练。导入训练集如图2-2,图2-3、图2-4所示。还可以点击图3-3的选项进行训练评估。如图2-4,确认无误点击确定。

2024-06-27 20:39:49 379

原创 MATLAB2024a下的BP神经网络分类工具箱预测

如图4-1、图4-2、图4-3、图4-4、图4-5、图4-6 所示,导入预测数据与导入训练数据系相同,熟悉了可以直接操作。如图3-1,调整验证集与测试集比例及隐藏层神经元个数后点击”训练“,开始训练。如图2-6,确定自己的特征与标签是行数据还是列数据。还可以点击图3-3的选项进行训练评估。导入特征如图2-2,图2-3所示。导入标签如图2-4,图2-5所示。如图2-7,确认无误点击确定。

2024-06-27 20:03:57 479

原创 MATLAB2024a下的神经网络时序工具箱回归预测

如图5-1、图5-2、图5-3、图5-4、图5-5、图5-6 所示,导入预测数据与导入训练数据系相同,熟悉了可以直接操作。如图4-1,调整验证集与测试集比例及隐藏层神经元个数与时滞后点击”训练“,开始训练。如图3-7,确定自己的特征与标签是行数据还是列数据 ,确认无误点击确定。如图1-1所示,打开神经网络时序工具箱。还可以点击图4-3的选项进行训练评估。导入特征如图3-3,图3-4所示。导入标签如图3-5,图3-6所示。excel文件导入一般选择”

2024-06-27 19:34:32 696

原创 MATLAB2024a下的BP神经网络回归工具箱预测

本文使用的是很新的MATLAB2024a下的BP神经网络回归工具箱,界面与其他老版本画风、设置有些区别。

2024-06-27 18:02:10 745

原创 基于python的随机森林多分类模型

如果模型的性能不够好,我们可以调整模型的参数(如决策树的数量、每个决策树的最大深度等)或增加更多的决策树来提高模型的性能。在多分类问题中,随机森林通过构建多个决策树,每个决策树都对数据进行分类预测,最终通过多数投票的方式确定样本所属的类别。综上,随机森林多分类模型通过构建多个基于随机抽样的决策树,并通过多数投票的方式确定样本所属的类别,从而实现了对多分类问题的有效预测。当满足停止条件时,将当前节点作为叶子节点,并根据该节点对应的训练子集中样本的类别分布情况,确定该叶子节点的类别标签。

2024-06-25 17:43:58 843

原创 Origin做聚类分析并利用聚类插件绘制热力图

在使用聚类APP进行聚类绘图前最好还是先归一化,此处在上一步已经归一化,这里不再展示。如图1-6所示,层次聚类分析的执行方法与K均值聚类相似,选中聚类列,接着点击“统计”—“多变量分析”—“系统聚类分析”—“上次使用的/打开对话框”step2、执行K均值聚类分析,如图1-3所示,选中聚类列,接着点击“统计”—“多变量分析”—“K-均值聚类分析”—“上次使用的/打开对话框”同样可以采用图2-3的另一APP进行环形聚类图的绘制。

2024-06-25 12:59:18 584

原创 【SHAP解释运用】基于python的树模型特征选择+随机森林回归预测+SHAP解释预测

听说最近SHAP解释很火,借鉴了几篇文章做了这个基于python的树模型特征选择+随机森林回归预测+SHAP解释预测。

2024-06-25 10:54:20 1619 4

原创 基于matlab的FCM聚类图像分割

FCM(Fuzzy C-Means)聚类图像分割原理主要基于模糊聚类理论,将图像中的像素点按照其灰度值、颜色或纹理等特征进行模糊划分,使得图像中具有相似特性的区域能够被聚类成同一类,进而实现图像的分割。FCM聚类算法是一种基于模糊理论的聚类算法,与传统的硬聚类(如K-means)不同,FCM允许一个像素点属于多个类别,每个像素点对每个类别的隶属度用一个介于0和1之间的数值来表示。FCM算法的目标是最小化均方差函数,该函数描述了所有像素点与其所属聚类中心的距离的平方和。图1 FCM聚类分割对比图。

2024-06-22 13:55:20 485

原创 基于matlab的K-means聚类图像分割

选择簇的数量(K)首先,用户需要指定要将图像数据分成多少个簇(即K的值)。初始化聚类中心随机选择K个像素点作为初始聚类中心。分配数据点到最近的聚类中心对于图像中的每个像素点,计算其与每个聚类中心的距离(如欧氏距离),并将其分配给距离最近的聚类中心所在的簇。更新聚类中心对于每个簇,计算该簇中所有像素点的平均值(或质心),并将这个平均值作为新的聚类中心。重复迭代重复步骤3和步骤4,直到聚类中心不再发生显著变化或达到预定的迭代次数。初始化:选择K个初始聚类中心。分配。

2024-06-22 13:43:08 517

原创 基于matlab的图像二值化

图像二值化是一种简单而有效的图像处理技术,通过设定阈值和灰度值比较,将原始灰度图像转换为黑白二值图像,从而便于后续的目标识别、特征提取等处理。在实际应用中,阈值的选择对二值化效果至关重要,需要根据具体任务和数据特点进行合理设定。图像二值化的原理是将彩色或灰度图像转换为只包含两种颜色(通常是黑色和白色)的二值图像的过程。其关键是通过设定一个阈值,将图像中的像素点的灰度值与阈值进行比较,根据比较结果将像素点设置为白色或黑色。

2024-06-22 13:33:07 222

原创 基于matlab的自适应阈值法图像分割

自适应阈值法图像分割通过计算图像的局部统计信息来确定每个像素的阈值,从而能够在不同的光照条件下自动调整阈值,提高图像分割的准确性和鲁棒性。大津阈值法(OTSU方法)是自适应阈值法的一种常见实现方式,它基于最大类间方差原理来确定最佳阈值。

2024-06-22 13:26:17 561

原创 基于matlab的图像多层小波变换

图1 各层小波分解的近似与分量。图4 各个小波系数直方图。图3 各层逆变换结果。

2024-06-22 13:11:11 317

原创 基于matlab的图像增强

在图像增强中,线性变换、非线性变换(包括伽马变换和对数变换)以及直方图均衡化是常用的技术。伽马变换是一种常用的非线性灰度变换方法,用于调整图像的对比度。它基于光照强度与人眼感知之间的非线性关系。直方图均衡化通过调整图像的灰度级分布,使得图像中的像素更加均匀地分布在整个灰度级范围内,从而增强图像的整体对比度。线性变换主要用于调整图像的对比度和亮度。对数变换通过拉伸低灰度级并压缩高灰度级来增强图像的暗部细节。图2 非线性变换与原始图像对比图。图1 线性变换与原始图像对比图。图3 总体变换对比图。

2024-06-22 12:55:34 356

原创 基于matlab的图像灰度化与图像反白

图像灰度化是将彩色图像转换为灰度图像的过程,使得每个像素点仅包含一个灰度值,从而简化了图像的复杂度。图像反白是将图像的暗色区域变为亮色,亮色区域变为暗色的过程。这通常用于增强图像的对比度,使图像更加清晰。通过图像灰度化和反白处理,可以方便地对图像进行后续的分析和处理。有一说一,反白图像这张图是不是挺有感觉的,嘿嘿。

2024-06-22 12:28:02 487

原创 基于matlab的不同边缘检测算子的边缘检测

边缘检测是图像处理和计算机视觉中的基本问题,其目的在于标识数字图像中亮度变化明显的点。这些变化通常反映了图像属性的重要事件和变化,如深度不连续、表面方向不连续、物质属性变化和场景照明变化等。边缘检测在特征提取中起着关键作用,因为它能够大幅度地减少数据量,并剔除不相关的信息,同时保留图像重要的结构属性。

2024-06-22 12:19:52 959

原创 基于matlab的高斯滤波与图像去噪

高斯滤波实质上是一种信号的滤波器,其用途是信号的平滑处理。其中,(G(x)) 表示高斯函数在 (x) 处的值,(\sigma) 是标准差,它决定了高斯函数的宽度,从而影响了滤波的强弱程度。其中,g(x, y)表示中值滤波后图像在(x, y)处的像素值,f(x, y)表示原始图像在(x, y)处的像素值,v = (m-1)/2,med表示取中值操作。这个公式描述了中值滤波的基本操作过程,即通过在图像上滑动一个固定大小的窗口,并将窗口内像素值的中值作为窗口中心像素的新值,来实现对图像的平滑去噪处理。

2024-06-22 11:48:38 934

原创 人工智能四要素

例如,在图像识别任务中,需要大量的标注图片作为输入,以训练出能够识别新图片的模型。随着研究的深入,新的算法不断涌现,旧有算法也在不断改进。- 知识在第一代人工智能中发挥了重要作用,而在第三代人工智能中,知识的作用被重新强调。多样化的数据可以确保模型在不同场景下的泛化能力,而大量数据则有助于提高模型的准确性和可靠性。从简单的线性回归到复杂的深度学习网络,算法的选择和应用直接决定了模型的性能。通过清洗、归一化等处理,可以提高数据的质量,从而使训练出的模型更加精确。- 算力为人工智能提供了基本的计算能力的支撑。

2024-06-20 07:59:18 366

原创 分类、回归与预测的关系误区

尽管分类和回归在目标变量的类型、模型输出和评估指标上存在明显差异,但它们的共同目标是使计算机能够从经验中自我改进,并解决越来越复杂的问题。我身边就有人分不清分类、回归与预测的关系,把回归和预测混为一谈,他们也觉得哪里不对,可也不甚在意。分类(Classification)和回归(Regression)是机器学习中两种主要的预测任务类型,**分类、回归与预测是机器学习领域核心概念,它们紧密相关但又具有各自独特的特征和应用场景**。,例如识别邮件是否为垃圾邮件,这是一个典型的二元分类问题。

2024-06-19 12:58:27 295 4

原创 Origin较好用的科研绘图软件

推荐自己也在用的科研绘图软件Origin

2024-06-18 14:19:27 1357

原创 你清楚这两个高中经典的复合函数吗?

2024-07-21 00:19:00 224

原创 基于python的去除图像内部填充

最终,这段代码会显示三个图像:原始图像、掩膜(仅显示轮廓)和结果图像(只包含原始图像中轮廓外围的区域)。该代码实现了一个图像处理的功能,具体来说是去除图像内部填充(或更准确地说,是提取并显示图像中轮廓的外围区域,而忽略内部填充)。由于matplotlib默认以RGB格式显示图像,而OpenCV以BGR格式读取图像,因此在显示之前需要将图像从BGR转换为RGB。:由于掩膜是灰度图像(单通道),而原图是BGR图像(三通道),因此需要将掩膜转换为三通道图像(使用。函数在边缘检测后的图像中查找轮廓。

2024-07-19 23:16:28 529

原创 基于python的层次聚类

算法将重复执行计算距离和合并簇的步骤,直到所有数据点都被合并成一个簇,或者达到预设的聚类数目。​ 是两个簇,x 和 z 分别是这两个簇中的样本点,dist(x,z) 是样本点 x 和 z 之间的距离(通常使用欧氏距离)。合并后的新簇将包含原来两个簇的所有样本点,并作为一个新的簇参与后续的计算。在簇内部,算法会计算任意两个样本点之间的距离,并找到距离最远的两个样本点。接下来,算法会计算原簇中剩余样本点到这两个新聚类中心的距离,并将每个样本点归入离其最近的一个聚类中心所对应的子簇中。将所有数据点归为一个簇。

2024-07-16 13:51:24 645

原创 基于python的图像去水印

从图2-1可以看出并没有完美去除水印,这是由水印与背景颜色接近造成的,后面我会用深度学习的方法探索一番。图2-1 去水印前后对比。

2024-07-16 13:04:27 527

原创 基于matlab的SVR回归模型

SVR(Support Vector Regression)回归预测原理,基于支持向量机(SVM)的回归分支,其核心思想是通过寻找一个最优的超平面来进行回归预测,并处理非线性回归问题。

2024-07-13 22:10:29 975

原创 深度学习、视觉定位文章发布预告

本人毕设论文已经选择基于Yolo的识别与定位,后面会开始学习这两个方面的知识,也会发布相关的文章,本人是智能科学与技术专业偏软方面,深度学习有一定的掌握,视觉定位知识面比较散,没有成系统的知识框架,不过在一些实践和图书馆借阅过相关书籍,有大学生通有的毛病:实操可以,理论不行,这一点在我之前的文章可能会有体现。

2024-07-11 00:07:46 1021

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除