自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 最大期望算法(EM)法的原理及应用场景

最大期望算法(Expectation-Maximization Algorithm,EM算法)在许多统计和机器学习任务中都有广泛的应用。

2023-08-21 09:23:58 708 1

原创 核主成分分析法原理及基于某段股票周期性波动的市场分析实战

核主成分分析(Kernel Principal Component Analysis,Kernel PCA)是主成分分析(PCA)的一种扩展形式,用于处理非线性数据。传统的PCA适用于线性数据,但在许多情况下,数据可能存在复杂的非线性关系。Kernel PCA通过使用核技巧,将数据映射到一个高维的特征空间,从而在新的特征空间中执行PCA。

2023-08-18 09:12:10 264 1

原创 eclat算法原理及基于网站用户异常分析的实战

Eclat(Eclat stands for "Equivalence Class Clustering and bottom-up Lattice Traversal") 是一种用于频繁项集挖掘的数据挖掘算法,用于从交易数据或事务数据库中发现频繁项集。频繁项集是指在数据集中频繁出现的物品的组合。Eclat算法通过使用垂直数据表示和基于逐层遍历的方法来实现频繁项集的挖掘。

2023-08-17 09:11:44 299 1

原创 PCA基本原理及基于机器学习时数据预处理的实战

主成分分析(Principal Component Analysis,简称PCA)是一种常用的降维技术,用于在保留数据中最大可解释方差的前提下,将原始数据投影到一个新的坐标系中。这些新的坐标轴被称为主成分,它们是原始特征的线性组合。PCA的主要目标是减少数据的维度,同时保留尽可能多的信息。

2023-08-16 09:55:44 318 1

原创 密度的聚类方法(DBSCAN)原理及基于癌症病理分析的应用实战

DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一种基于密度的聚类算法,它可以识别数据集中的高密度区域,并将其视为一个簇,同时可以识别低密度区域作为噪声点。

2023-08-15 09:20:08 265 1

原创 梯度下降法原理及基于图像处理的实战

梯度下降法是一种常用于优化机器学习模型的迭代优化算法,其核心原理是通过反复调整模型参数以最小化损失函数。这种方法特别适用于求解复杂的非线性问题,例如训练神经网络等。

2023-08-14 09:27:08 549

原创 神经网络原理及基于电影评价情感分析的实战

神经网络是一种受到人类神经系统启发的机器学习算法,用于模拟和解决各种复杂的问题,例如图像识别、自然语言处理、语音识别等。神经网络的原理基于一系列相互连接的神经元,通过学习和调整连接权重来执行任务。神经网络的基本单元是神经元,也被称为节点或单元。每个神经元接收多个输入,执行一些计算,并产生一个输出。输入通过加权连接传递给神经元,然后通过激活函数进行处理。每个输入连接都有一个关联的权重,表示了输入对神经元的影响程度。权重越大,表示输入对神经元的影响越显著。训练过程中,神经网络通过调整这些权重来学习任务。

2023-08-12 09:08:35 256 1

原创 (支持向量机)SVM算法原理及基于癌症类型识别的实战

支持向量机(Support Vector Machine,SVM)是一种在机器学习中广泛应用的监督学习算法,用于分类和回归问题。其基本原理是在特征空间中寻找一个超平面,以最大化不同类别之间的间隔,并将数据点分隔开。

2023-08-11 09:12:10 196 1

原创 随机森林算法原理及基于银行信贷风险评估的实战

随机森林(Random Forest)是一种集成学习(Ensemble Learning)算法,通过将多个决策树集成在一起,以提高整体模型的性能和泛化能力。随机森林适用于分类和回归问题,并且在处理高维数据、大量样本和特征选择等方面表现出色。

2023-08-10 09:15:28 681

原创 Apriori算法原理及基于超市商品售卖关联分析的实战

Apriori算法是一种用于数据挖掘和关联规则挖掘的经典算法,用于发现数据集中的频繁项集以及它们之间的关联规则。该算法是由Agrawal和Srikant于1994年提出的,它基于一种称为“逐层搜索”的思想,逐步构建候选项集并剪枝以减少计算量。

2023-08-09 09:27:21 512

原创 k-means算法原理及基于客户种类分析的应用

K-means算法是一种常用于聚类分析的无监督学习算法,用于将一组数据点分成多个不同的簇(clusters)。每个簇包含相似的数据点,而不同簇之间的数据点差异较大。K-means算法的目标是将数据点划分到K个簇中,其中K是用户预先指定的参数。

2023-08-08 10:30:37 188

原创 决策树算法原理及基于分类的应用

决策树算法是一种常用的机器学习算法,用于分类和回归任务。其原理基于树形结构,通过一系列的决策节点将输入数据逐步分割成不同的类别或数值区间。

2023-08-07 10:44:48 367

原创 逻辑回归算法原理及基于新闻文本分类的应用

逻辑回归是一种简单而有效的分类算法,尤其适用于二分类问题。它基于线性模型和S形函数,通过梯度下降等优化方法,寻找最优参数,使模型能够对新的样本进行准确分类。

2023-08-04 10:21:12 304 1

原创 KNN算法的分类原理及基于豌豆品种分类的应用

将K最近邻(KNN)算法用于豌豆品种分类时,需要将豌豆的特征数据转换为特征向量,然后使用KNN算法进行分类。以下是一个简单的Python代码示例,演示如何在豌豆品种分类中应用KNN算法。

2023-08-03 10:38:09 110

原创 基于朴素贝叶斯算法的分类应用

基于朴素贝叶斯算法的分类应用包括文本分类、垃圾邮件过滤和情感分析等。它通过计算给定特征的条件概率,结合贝叶斯定理,从而进行分类预测。虽然朴素贝叶斯在处理高维数据和文本数据方面表现良好,但它在处理特征间相关性较强的数据上可能表现不佳。

2023-08-02 12:26:23 118 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除