人工智能高级程序语言设计《初级》---机器学习
文章平均质量分 93
纯Python,无框架的机器学习
ZHW_AI课题组
这个作者很懒,什么都没留下…
展开
-
基于BP神经网络实现鸢尾花数据集分类
BP神经网络是一种按误差反向传播,简称误差反传训练的多层前馈网络,其算法称为BP算法,它的基本思想是梯度下降法,利用梯度搜索技术,以期使网络的实际输出值和期望输出值的误差均方差为最小。基本算法包括信号的前向传播和误差的反向传播两个过程。即计算误差输出时按从输入到输出的方向进行,而调整权值和阈值则从输出到输入的方向进行。BP神经网络由输入层、隐含层(也称中间层)和输出层构成 ,其中隐含层有一层或者多层。每一层可以有若干个节点。层与层之间节点的连接状态通过权重来体现。原创 2024-06-14 18:52:26 · 1276 阅读 · 0 评论 -
基于随机森林的鲍鱼年龄预测
郝浩,男,西安工程大学电子信息学院,2023级研究生研究方向:输电线路绝缘子缺陷检测电子邮件:2606801894@qq.com随机森林(Random Forest)是一种集成学习方法,广泛应用于分类和回归任务。它是由Leo Breiman和Adele Cutler在2001年提出的,是基于决策树(Decision Tree)的组合模型。。此数据集数据以逗号分隔,没有列头。每个列的名字存在另外一个文件中。原创 2024-06-14 15:43:35 · 1147 阅读 · 0 评论 -
基于BP神经网络对鸢尾花数据集分类
BP神经网络是一种基于误差反向传播算法的人工神经网络,是应用最广泛的神经网络。可以用来解决分类、回归、模式识别、数据挖掘等多种问题。它的基本思想是梯度下降法,利用梯度搜索技术,以期使网络的实际输出值和期望输出值的误差均方差为最小。BP神经网络由输入层、隐含层和输出层组成,其中隐含层可以包含多个神经元原创 2024-06-13 16:26:50 · 980 阅读 · 0 评论 -
OPTICS聚类算法的实现
OPTICS 的输出是一系列有序的点,每个点有一个核心距离和可达距离。通过这些距离,可以生成一个可达距离图(reachability plot),分析图中的距离变化可以确定不同密度的簇。原创 2024-06-13 15:59:09 · 1090 阅读 · 0 评论 -
基于MDS的波士顿房价数据集降维
黄雨浩,男,西安工程大学电子信息学院,2023级研究生研究方向:机器视觉与人工智能电子邮件:1986506577@qq.com孙思伟,男,西安工程大学电子信息学院,2023级研究生,张宏伟人工智能课题组研究方向:深度强化学习与人工智能电子邮件:sunsiwei0109@163.com多维尺度分析(Multi-Dimensional Scaling, MDS)是一种统计学方法,用于将复杂、高维的相似性或距离数据转化为直观的、低维的可视化表示。原创 2024-06-11 17:14:56 · 739 阅读 · 0 评论 -
利用梯度提升树分类法实现乳腺癌数据集分类
Freidman提出用损失函数的负梯度来拟合损失的近似值,所以结合得到了梯度提升树算法。而本次实验所使用的是梯度提升树分类算法,它是通过逐步构建一系列的决策树,每棵树都拟合前一棵树的残差,从而逐步提高模型的预测性能。通过对乳腺癌数据集的分类,梯度提升树能够有效地区分良性和恶性肿瘤,同时提供每个特征的重要性,从而帮助理解哪些特征对预测结果影响最大。原创 2024-06-07 19:45:39 · 1325 阅读 · 0 评论 -
使用AdaBoost分类方法实现对Wine数据集分类
AdaBoost (Adaptive Boosting-自适应增强), AdaBoost通过组合多个弱分类器(那些比随机猜测略好的分类器)来构建一个强分类器。这短短一句话读完就会发现信息量挺大的,什么是弱分类器?什么是强分类器?是如何进行自适应增强的?以及怎么组合成一个强分类器的?把这四个问题搞懂,可能就会更容易理解AdaBoost原创 2024-06-04 19:48:43 · 1013 阅读 · 0 评论 -
基于网格的CLIQUE聚类算法的实现
CLIQUE算法是基于网格的空间聚类算法,但它同时也非常好的结合了基于密度的聚类算法,因此既能够发现任意形状的簇,又可以像基于网格的算法一样处理较大的多维数据。CLIQUE就是将数据空间划分为网格单元,将数据对象集映射到网格单元中,并计算每个单元的密度。根据预设的 密度阈值 判断每个网格单元是否为 高密度单元,由邻近的稠密单元组形成 “类”(簇)。总结之就是:CLIQUE算法是一种基于网格的聚类算法,用于发现子空间中基于密度的簇。原创 2024-06-04 10:34:57 · 1524 阅读 · 0 评论 -
基于线性回归根据饮食习惯和身体状况估计肥胖水平
刘欢,女,西安工程大学电子信息学院,2023级研究生研究方向:机器视觉与人工智能电子邮件:2768691353@qq.com孙思伟,男,西安工程大学电子信息学院,23级研究生研究方向:深度强化学习与人工智能电子邮件:sunsiwei0109@163.com该数据集来自于UCL机器学习知识库,数据集包括墨西哥、秘鲁和哥伦比亚等国基于饮食习惯和身体状况的个体肥胖水平估计数据。原创 2024-06-03 19:57:35 · 1797 阅读 · 0 评论 -
基于梯度提升树回归模型的房地产价格估计
雷强,男,西安工程大学电子信息学院,2023级研究生研究方向:机器视觉与人工智能电子邮件:3160698422@qq.com孙思伟,男,西安工程大学电子信息学院,23级研究生研究方向:深度强化学习与人工智能电子邮件:sunsiwei0109@163.com梯度提升树回归算法的原理是通过迭代地训练多棵决策树,每棵树基于前一棵树的残差进行学习,以最小化预测误差,并将它们的预测结果进行加权融合,从而提高对连续变量的预测精度。原创 2024-06-03 17:25:10 · 735 阅读 · 0 评论 -
基于t-SNE的泰坦尼克号数据集降维
基于t-SNE的泰坦尼克号数据集降维原创 2024-06-03 16:23:08 · 1104 阅读 · 0 评论 -
高斯混合模型聚类算法的实现
高斯混合聚类(Gaussian Mixture Model,GMM)是一种基于概率模型的聚类算法。它假设每个簇都由多个高斯分布组成,即每个簇的数据点都是从不同的高斯分布中采样得到的。在高斯混合模型中,每个簇由以下三个参数定义:均值向量(mean vector)、协方差矩阵(covariance matrix)和权重(weight)。GMM的核心在于它能够捕捉数据中的复杂结构,允许数据点以不同的概率属于多个聚类。原创 2024-06-02 09:15:51 · 1293 阅读 · 0 评论 -
基于LDA与PCA算法的鸢尾花数据集二维投影比较
LDA在保留类别信息方面表现优秀。LDA通过最大化类间散度和最小化类内散度,能够在降维的同时最大化不同类别之间的可分性。在二维投影中,LDA能够有效地将不同鸢尾花类别分开,并展现出明显的聚类效果。PCA在数据展示和压缩方面具有优势。PCA通过选择方差最大的投影方向,能够在保留数据的主要信息的同时,实现较好的数据压缩效果。在二维投影中,PCA将数据集分布在两个主要方向上,并显示出数据的整体分布情况。综上所述,对于鸢尾花数据集,LDA在保留类别信息和类别区分方面表现出色,而PCA则更适合用于数据的展示和压缩原创 2023-06-19 16:18:20 · 1021 阅读 · 0 评论 -
K近邻算法实现红酒数据集分类
路治东,男,西安工程大学电子信息学院,2022级研究生,张宏伟人工智能课题组研究方向:机器视觉与人工智能电子邮件:206307079527@qq.com原理:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,那么该样本也属于这个类别。简单来说就是,求两点之间的距离,看距离谁是最近的,以此来区分我们要预测的这个数据是属于哪个分类。我们看图来理解一下。蓝色点是属于a类型的样本点,粉色点是属于b类型的样本点。原创 2023-05-24 21:56:56 · 2990 阅读 · 0 评论 -
对比K近邻算法与决策树算法在MNIST数据集上的分类性能
郝特吉,男,西安工程大学电子信息学院,2022级研究生研究方向:机器视觉与人工智能电子邮件:826844822@qq.com路治东,男,西安工程大学电子信息学院,2022级研究生,张宏伟人工智能课题组研究方向:机器视觉与人工智能电子邮件:2063079527@qq.comK近邻是一种经典且简单的监督学习方法,既能够用来解决分类问题,也能够解决回归问题。原理:当对测试样本进行分类时,通过扫描训练样本集,找到与该测试样本最相似的个训练样本,根据这个样本的类别进行投票确定测试样本的类别。原创 2023-06-10 17:08:41 · 1375 阅读 · 0 评论 -
层次聚类算法的实现
目录1.作者介绍2.层次聚类算法介绍2.1 层次聚类算法原理2.2 层次聚类算法步骤2.3 层次聚类算法分类3.层次聚类算法实现(代码如下)3.1 相关包导入3.2 生成测试数据集3.3 层次聚类实现&画出树状图3.4 获取聚类结果3.5 对比不同方法聚类效果4.参考链接1.作者介绍杨金花,女,西安工程大学电子信息学院,21级研究生研究方向:基于学习方法的运动目标检测电子邮件:2902551510@qq.com2.层次聚类算法介绍2.1 层次聚类算法原理 聚类就是对大量未知标注的数据集原创 2022-04-12 16:16:50 · 16121 阅读 · 5 评论 -
Birch聚类算法的实现
本博文对Birch聚类算法的实现过程进行了展示。BIRCH的全称是利用层次方法的平衡迭代规约和聚类(Balanced Iterative Reducing and Clustering Using Hierarchies)原创 2022-04-12 09:38:04 · 2324 阅读 · 0 评论 -
基于SVM的糖尿病数据集回归问题
目录1. 作者介绍2. SVM算法介绍2.1 支持向量机分类2.2 支持向量回归模型2.3 核函数和损失函数2.4 SVR模型的代价函数3. 实验过程3.1 数据集介绍3.2 实验代码3.3 运行结果1. 作者介绍谢蓉蓉,女,西安工程大学电子信息学院,2021级研究生研究方向:图像处理电子邮件:443369505@qq.com吴燕子,女,西安工程大学电子信息学院,2021级研究生,张宏伟人工智能课题组研究方向:人工智能与模式识别电子邮件:1219428323@qq.com2. SVM算法介绍原创 2022-04-10 21:33:33 · 5284 阅读 · 1 评论 -
Affinity Propagation聚类算法的实现
本博文实现了Affinity Propagation聚类算法的应用原创 2022-04-08 10:30:36 · 1356 阅读 · 0 评论 -
DBSCAN聚类算法的实现
DBSCAN聚类算法的实现1. 作者介绍2.关于理论方面的知识介绍2.1 DBSCAN算法介绍2.2 鸢尾花数据集介绍3.实验过程3.1 实验代码3.2 实现过程3.3 实验结果4.参考文献1. 作者介绍刘鹏程,男,西安工程大学电子信息学院,2021级硕士研究生研究方向:机器视觉与人工智能电子邮件:1084823951@QQ.com孟莉苹,女,西安工程大学电子信息学院,2021级硕士研究生,张宏伟人工智能课题组研究方向:机器视觉与人工智能电子邮件:2425613875@qq.com2.关于理原创 2022-04-07 22:20:10 · 7300 阅读 · 0 评论 -
基于LASSO的波士顿房价分析
目录1. 作者介绍2. 算法介绍2.1 Lasso算法介绍2.2 公式分析2.3 特点分析3. 实验过程3.1 数据集介绍3.2 实验代码3.3 运行结果3.4 结果分析1. 作者介绍符振涛,男,西安工程大学电子信息学院,2021级研究生研究方向:机器视觉与人工智能电子邮件:2673229503@qq.com吴燕子,女,西安工程大学电子信息学院,2021级研究生,张宏伟人工智能课题组研究方向:机器视觉与人工智能电子邮件:1219428323@qq.com2. 算法介绍2.1 Lasso算法原创 2022-04-07 21:14:20 · 2902 阅读 · 1 评论 -
基于最近邻的邻鸢尾花数据集回归问题
目录1. 作者介绍2.最近邻算法介绍2.1 最近邻算法介绍2.2 KNN分类与回归分类:2.3 KNN回归算法流程3. 实验过程3.1 鸢尾花数据集3.2代码实现3.3实验结果3.4问题分析1. 作者介绍王倩倩,女,西安工程大学电子信息学院,2021级研究生研究方向:智能信息处理电子邮件:2421926488@qq.com吴燕子,女,西安工程大学电子信息学院,2021级研究生,张宏伟人工智能课题组研究方向:机器视觉与人工智能电子邮件:1219428323@qq.com2.最近邻算法介绍2.原创 2022-04-06 20:30:20 · 1345 阅读 · 1 评论 -
基于朴素贝叶斯的鸢尾花数据集分类
本博文实现了基于朴素贝叶斯的鸢尾花数据集分类原创 2022-04-06 10:45:09 · 21814 阅读 · 9 评论 -
基于朴素贝叶斯算法的新闻分类
本博文实现了基于朴素贝叶斯算法的新闻分类原创 2022-04-02 10:58:09 · 3990 阅读 · 2 评论 -
基于集成算法投票的波士顿房价数据集回归问题
基于集成算法投票的波士顿房价数据集回归问题1. 作者介绍1. 作者介绍成帅凯,男,西安工程大学电子信息学院,21级研究生研究方向:机器视觉与人工智能电子邮件:1696153192@qq.com孟莉苹,女,西安工程大学电子信息学院,2021级硕士研究生,张宏伟人工智能课题组研究方向:机器视觉与人工智能电子邮件:2425613875@qq.comxxx(姓名),x(性别),西安工程大学电子信息学院,xxxx级研究生,张宏伟人工智能课题组研究方向:机器视觉与人工智能电子邮件:xxxxxxxxx原创 2022-03-29 20:55:27 · 1308 阅读 · 0 评论 -
基于Isotonic回归(保序回归算法)的鸢尾花数据集回归问题
基于Isotonic回归的鸢尾花数据集回归问题1. 作者介绍2.保序回归算法2.1 算法原理2.2 保序回归算法举例3. 鸢尾花数据集介绍3.1 数据集获取4.代码实现4.1 导入需要的包4.2 下载鸢尾花数据集并输出每个样本特征属性4.3 利用PCA降维并调用保序回归4.4 实验结果4.5 完整代码1. 作者介绍刘静,女,西安工程大学电子信息学院,2021级硕士研究生研究方向:机器视觉与人工智能电子邮件:2350588223@qq.com2.保序回归算法2.1 算法原理保序回归是回归算法的原创 2022-03-29 18:52:19 · 1150 阅读 · 0 评论 -
基于神经网络多层感知器的波士顿房价数据集回归问题
目录1. 作者介绍2. 神经网络多层感知器2.1 前向传播与反向传播2.2损失函数2.3激活函数3. 实验过程3.1波士顿房价数据集3.2实验代码3.3运行结果1. 作者介绍邓越,男,西安工程大学电子信息学院,2021级研究生研究方向:机器视觉与人工智能电子邮件:2570878225@qq.com吴燕子,女,西安工程大学电子信息学院,2021级研究生,张宏伟人工智能课题组研究方向:模式识别与人工智能电子邮件:wuyanzi990502@163.com2. 神经网络多层感知器 多层感知器原创 2022-03-28 20:54:54 · 2421 阅读 · 0 评论 -
基于最邻近算法的糖尿病数据集回归
目录1. 作者介绍2. KNN网络简介(K- Nearest Neighbor)2.1 基于最邻近算法的分类2.2 基于最邻近算法的回归3. 实验相关3.1 实验环境3.2 数据集介绍3.3 数据可视化及其分析3.4 导入KNN回归模型进行回归预测3.5 实验结果分析与总结附完整代码(5部分)第一部分:选取最优超参数K值第二部分:用所有特征进行预测第三部分:选取部分特征进行回归预测第四部分:对每一个特征进行分析第五部分:两两特征的相关性分析,主要是看预测的目标和每个特征的相关性1. 作者介绍姚同钰,女,原创 2022-03-21 22:09:36 · 2604 阅读 · 7 评论 -
基于SVM的乳腺癌数据集分类
本博文实现基于SVM的乳腺癌数据集分类问题原创 2022-03-21 22:07:35 · 17541 阅读 · 4 评论 -
基于随机森林算法的糖尿病数据集回归
线性回归模型之波士顿房价预测作者介绍1. 随机森林算法原理1.1决策树与Bagging1.2 随机森林算法2. 实验过程2.1 糖尿病数据集2.2 实验过程2.3 实验结果展示2.4 完整实验代码作者介绍李怡格,女,西安工程大学电子信息学院,2021级研究生研究方向:脑电情绪识别电子邮件:1719614085@qq.com1. 随机森林算法原理1.1决策树与Bagging(一)决策树决策树算法是一种有监督的机器学习方法。在分类问题中,决策树算法的本质是通过归纳数据中蕴含的分类规则将样本划分原创 2022-03-21 22:11:13 · 4194 阅读 · 2 评论