数据挖掘
bingo~ 针对现阶段学期所学关于【数据挖掘】这门课程的知识总结与归纳,以便后期复习,随时查阅
Little-BingoQ
这个作者很懒,什么都没留下…
展开
-
【数据挖掘】第6章 关联分析: 基本概念和算法
6 关联分析: 基本概念和算法目录一、问题定义二、频繁项集的产生1)先验原理2)Apriori算法的频繁项集产生3)候选的产生与剪枝4)支持度计数5)计算复杂度三、规则的产生一、问题定义关联分析关联分析用于发现隐藏在大型数据集中的令人感兴趣的联系,所发现的模式通常用关联规则或频繁项集的形式表示。关联分析可以应用于生物信息学、医疗诊断、网页挖掘、科学数据分析等频繁项集项集:包含0个或多个项的集合 例子: {Milk, Bread, Diaper}k-项集:如果一个项集包含k个项.原创 2020-06-11 23:47:21 · 4861 阅读 · 0 评论 -
【数据挖掘】第8章 聚类分析: 基本概念和算法
8 聚类分析: 基本概念和算法目录一、聚类分析概述1)什么是聚类分析2)不同的簇类型3)聚类算法的分类二、K-均值聚类算法1)基本K均值算法2)k-中心点聚类方法三、凝聚层次聚类1)基本的凝聚层次聚类算法2)如何计算簇之间的邻近性3)层次聚类的主要问题四、DBSCAN一、聚类分析概述1)什么是聚类分析聚类分析仅根据在数据中发现的描述对象及其关系的信息,将数据对象分组。其目标是, 组内的对象之间是相似的(相关的),而不同的组中的对象是不同的(不相关的)。组内的相似性(同质性)越大,组间差别越大,.原创 2020-05-25 23:28:29 · 3282 阅读 · 0 评论 -
【数据挖掘】第5章 分类:其他技术
5 分类:其他技术目录一、最近邻分类器一、最近邻分类器最近邻:和测试样例的属性相对接近的所有训练记录,称为(测试样例的)的最近邻。利用最近邻可以对测试样例进行分类最近邻分类器把每个样例看做d维空间上的一个数据点,其中d是属性个数。给定一个测试样例,利用任意一种邻近性度量,计算该测试样例与训练集中其他数据点的邻近度。给定样例z的k-最近邻是指和z距离最近的k个数据点.k-最近邻...原创 2020-05-06 18:55:10 · 769 阅读 · 0 评论 -
【数据挖掘】第4章 分类:基本概念、决策树与模型评估
4 分类:基本概念、决策树与模型评估目录一、解决分类问题的一般方法二、决策树归纳1)决策树工作原理2)如何建立决策树3)ID3决策树4)表示属性测试条件的方法一、解决分类问题的一般方法分类: 分类任务就是通过学习得到一个目标函数f,把每个属性集x映射到一个预先定义的类标号y中。目标函数也称分类模型。解决分类问题的一般方法基本概念训练集:数据库中为建立模型而被分析的数据...原创 2020-04-16 16:09:51 · 2239 阅读 · 0 评论 -
【数据挖掘】MATLAB实现K最近邻算法
K最近邻算法的MATLAB实现代码实现实现程序如下:测试代码:function mainload('testingData.mat'); %载入数据--测试样本load('trainingData.mat'); %载入数据--训练样本trAttr = trAttr(:,1:end);trLabels = trLabels(:,end);tstAttr = tstAttr(...原创 2020-04-08 17:08:12 · 3903 阅读 · 1 评论 -
【数据挖掘】MATLAB实现简单匹配系数、Jaccard系数的计算
简单匹配系数、Jaccard系数的MATLAB实现问题描述实现任意给定两个相同维度的布尔向量之间的简单匹配系数、Jaccard系数计算函数代码实现实现程序如下图所示:% 简单匹配系数% function dist1 = dist_SMC(x,y)function dist1 = dm(x,y)[m,n]=size(x);f00 = 0;f01 = 0;f10 = 0;f...原创 2020-04-08 16:53:26 · 4587 阅读 · 3 评论 -
【数据挖掘】MATLAB实现欧氏距离计算
欧氏距离的MATLAB实现问题描述实现任意给定两个相同维度的向量之间的欧氏距离计算函数dist_E(x,y)。测试代码:x=[1,3,0,2]; y=[2,3,2,0]; dist=dist_E(x,y);代码实现实现程序如下图所示:% 方法1function dist = dist_E(x,y)dist = [];if(length(x)~=length(y)) ...原创 2020-04-08 09:24:01 · 30848 阅读 · 0 评论 -
【数据挖掘】第2章 数据
2 数据目录一、数据类型1)基本概念2)属性的类型3)数据集的一般特性4)数据集类型(三大类)二、数据质量数据中可能存在的问题三、数据预处理四、相似性和相异性度量一、数据类型1)基本概念数据:数据集可以看做数据对象的集合。 数据对象有时也叫做记录、点、向量、模式、案例、样本、观测或实体。数据对象用一组刻画对象基本特性的属性描述。 属性有时也叫做变量、特性、字段、特征或维。通常...原创 2020-03-30 16:57:58 · 1878 阅读 · 0 评论 -
【数据挖掘】MATLAB基础练习题
MATLAB基础练习题目录1、按要求写出实现该功能的代码2、练习矩阵定位函数find的使用3、练习子矩阵的赋值、删除等操作4、练习常用函数的使用:5、按要求编写fun函数:1、按要求写出实现该功能的代码1)使用方括号“[ ]”操作符产生一个列向量x,内容为1,2,4,7 x=[1;2;4;7]2)使用方括号“[ ]”操作符产生一个行向量x,内容为1,2,4,7x=[1 2 4 7...原创 2020-03-25 08:03:30 · 5178 阅读 · 0 评论 -
【数据挖掘】MATLAB基础
MATLAB基础目录帮助命令MATLAB编程基础1)数据类型2)变量3)数组/矩阵操作4)运算符5)表达式MATLAB程序设计1)M文件2)函数3)程序流程控制帮助命令help命令是查询函数语法的最基本方法,查询信息会直接显示在命令窗口中。适用于已知命令但不知道具体用法的情况。 如: >>help imshowMATLAB编程基础1)数据类型2)变量变量的...原创 2020-03-25 08:02:38 · 2941 阅读 · 0 评论 -
【数据挖掘】第1章 绪论
1 绪论目录前言基础知识1)数据挖掘2)数据挖掘任务章节小练前言数据挖掘应用:人脸识别、语音识别、手写数字识别、垃圾邮件过滤、电子商务网站的推荐算法…为什么进行挖掘数据?(商业)大量数据被收集,存储在数据库 数据仓库中;计算机越来越便宜,功能越来越强大;竞争压力越来越大(科学)数据以极快的速度收集和存储 (GB/hour);传统的技术难以处理这些原始数据;数据挖掘可能帮...原创 2020-03-25 08:00:53 · 350 阅读 · 0 评论