从零开始学Matlab
文章平均质量分 70
nefu-ljw
这个作者很懒,什么都没留下…
展开
-
数据挖掘实验(八)综合实验【自选项目】
本文代码均已在 MATLAB R2019b 测试通过,如有错误,欢迎指正。(一)前言我选择的内容是关联规则挖掘,这个之前在实验六是做过的,但是当时我并没有写数据预处理的部分,而是直接用的已经整理好的整型数据,同时有一个缺点是数据量不够大。所以在这次综合实验部分,我继续改进Apriori算法的代码,并且找到了一个数据量大一些的数据集,在MATLAB R2019b版本上通过测试。总共写了200多行代码,全部都是我自己写的,不保证代码没有bug。本文所有代码和原数据集可以在此下载:https://down原创 2020-11-25 18:47:55 · 3348 阅读 · 2 评论 -
数据挖掘实验(七)Matlab实现聚类算法【clusterdata / kmeans】
本文代码均已在 MATLAB R2019b 测试通过,如有错误,欢迎指正。另外,这次实验都是调用Matlab现成的函数,没什么技术含量。(一)聚类分析的原理聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类分析所使用方法的不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类数未必一致。从原创 2020-11-23 15:42:06 · 15238 阅读 · 7 评论 -
数据挖掘实验(六)Matlab实现Apriori算法【关联规则挖掘】
文章目录(一)关联规则挖掘(二)Apriori关联规则挖掘算法的基本思想(三)问题描述(四)Matlab实现Apriori挖掘算法,提取关联规则(一)关联规则挖掘关联规则挖掘(Association rule mining)是数据挖掘中最活跃的研究方法之一,可以用来发现不同事物之间的联系,最早是为了发现超市交易数据库中不同的商品之间的关系。例如一个超市的经理想要更多的了解顾客的购物习惯,比如“哪组商品可能会在一次购物中同时被购买?”或者“某顾客购买了个人电脑,那该顾客三个月后购买数码相机的概率有多大?原创 2020-11-20 12:05:21 · 14206 阅读 · 15 评论 -
数据挖掘实验(五)Matlab实现Bayes算法【朴素贝叶斯分类】
本文代码均已在 MATLAB R2019b 测试通过,如有错误,欢迎指正。(一)Bayes算法的基本原理设X∈Ω是一个类别未知的数据样本,cjc_jcj为某个类别,若数据样本X属于一个特定的类别cjc_jcj,那么分类问题就是决定P(cjc_jcj|X),即在获得数据样本X时,确定X的最佳分类。P(cjc_jcj|X):即给定数据样本X时cjc_jcj成立的后验概率,是我们所感兴趣的。P(cjc_jcj) :类cj的先验概率(prior probability)。P(X|cjc_j原创 2020-11-10 00:48:28 · 6143 阅读 · 1 评论 -
数据挖掘实验(四)Matlab实现CART算法【生成分类树/回归树】
本文代码均已在 MATLAB R2019b 测试通过,如有错误,欢迎指正。这次实验只要会调用Matlab现成的函数就行了,不用自己写CART算法。(一)CART生成算法的基本原理CART是分类与回归树的简称,最终结果是二叉树,可以用于分类,也可以用于回归问题。分类树的输出是样本的类别, 回归树的输出是一个实数。自上而下从根开始建立节点,在每个节点处要选择一个最好的属性来分裂,使得子节点中的训练集尽量的纯。分类问题,可以选择GINI作为纯度指标;回归问题,可以使用最小二乘偏差(LSD)或最小绝对偏原创 2020-11-10 00:26:37 · 6267 阅读 · 5 评论 -
数据挖掘实验(三)Matlab初步实现ID3算法【决策树根节点选择】
本文代码均已在 MATLAB R2019b 测试通过,如有错误,欢迎指正。(一)决策树生成算法的基本原理决策树是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策树对新数据进行分类。决策树是类似流程图的倒立的树型结构。最顶层节点为根节点,是整个决策树的开始;树的每个内部节点表示在一个属性上的测试,其每个分支代表一个测试输出;树的每个叶节点代表一个类别。最后生成类似于下图所示的决策树。(二)ID3算法的基本原理ID3算法主要针对属性选择问题而提出,是决策树学习方原创 2020-11-09 22:00:34 · 4444 阅读 · 1 评论 -
数据挖掘实验(二)数据预处理【等深分箱与等宽分箱】
本文代码均已在 MATLAB R2019b 测试通过,如有错误,欢迎指正。一、分箱平滑的原理(1)分箱方法在分箱前,一定要先排序数据,再将它们分到等深(等宽)的箱中。常见的有两种分箱方法:等深分箱和等宽分箱。等深分箱:按记录数进行分箱,每箱具有相同的记录数,每箱的记录数称为箱的权重,也称箱子的深度。等宽分箱:在整个属性值的区间上平均分布,即每个箱的区间范围设定为一个常量,称为箱子的宽度。(2)数据平滑将数据划分到不同的箱子之后,可以运用如下三种策略对每个箱子中的数据进行平滑处理原创 2020-10-30 11:47:38 · 25168 阅读 · 0 评论 -
数据挖掘实验(一)数据规范化【最小-最大规范化、零-均值规范化、小数定标规范化】
本文代码均已在 MATLAB R2019b 测试通过,如有错误,欢迎指正。一、数据规范化的原理数据规范化处理是数据挖掘的一项基础工作。不同的属性变量往往具有不同的取值范围,数值间的差别可能很大,不进行处理可能会影响到数据分析的结果。为了消除指标之间由于取值范围带来的差异,需要进行标准化处理。将数据按照比例进行缩放,使之落入一个特定的区域,便于进行综合分析。(1)最小-最大规范化假定min和max分别为属性A的最小值和最大值,则通过下面公式将属性A上的值v映射到区间[new_min, new_max]原创 2020-10-30 11:43:10 · 11744 阅读 · 3 评论 -
从零开始学Matlab(二) 绘制图像、读取excel表格、时间处理
文章目录一、绘图代码示例二、读取excel表格三、时间处理函数四、实例:绘制广东历史疫情曲线图(时间作为x轴)% 初始化clear;clc;% 将图片的字体等格式设置成latex样式,方便输入公式set(0,'defaulttextinterpreter','latex');set(0,'defaultAxesTickLabelInterpreter','latex');set(0,'defaultLegendInterpreter','latex');原创 2020-09-10 16:43:14 · 4013 阅读 · 5 评论 -
从零开始学Matlab(一) 矩阵的基本操作、输入输出、函数
运行软件:MATLAB R2019b内置常量>> eps // 计算机的最小数ans = 2.2204e-16>> pi // 圆周率 ans = 3.1416 >> i // sprt(-1)ans = 0.0000 + 1.0000i>> j // sprt(-1)ans = 0.0000 + 1.0000i产生行向量>> t=[0:0.2:0.6] // [0,0.原创 2020-09-04 21:31:22 · 14768 阅读 · 4 评论