数据挖掘
Sweet_Spot
这个作者很懒,什么都没留下…
展开
-
数据挖掘冰山立方体的构建:BUC算法的实现
1.首先处理输入数据文件中数据的读入,数据存放在BUC.csv文件中,每一行为一组维度组合序列,表示该序列出现一次。读取该文件,将数据保存在列表record中,保存形式如下:record = [[‘a1’,‘b1’,‘c1’],[‘a2’,‘b1’,‘c2’]...]返回record记录的同时返回不同维度的类别,如[‘a’,‘b’,‘c’]本部分代码如下:#读取文件,并将数据存储到re...原创 2019-04-29 16:56:10 · 1193 阅读 · 0 评论 -
K-means算法实现
1.实验数据构建首先构建实验所用的数据,这里我才用的是随机数生成的形式,生成1000个二维空间的点,存储到特定文件与集合中,并在函数结束时将集合返回。代码如下:2.K-means算法实现有了数据之后,接下来要做的就是K-means算法本身的实现了,首先,先初始化k个点作为初始中心点,这里的k值我设置为3。为了使得生成的初始中心点与实际的数据点分布相符,我采用了x_rand = min ...原创 2019-05-09 21:41:14 · 2082 阅读 · 0 评论 -
山东大学软件学院《数据仓库与数据挖掘》复习知识点
11.1数据分析的定义数据分析是指用适当的分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据分析的目的数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出研究对象的内在规律。数据分析的六大步骤明确目的和思路(先决条件、提供项目方向)、数据收集(数据库建立)、数据处理(清洗、转化、提取、计算)、数据分析(数据...原创 2019-05-21 23:17:12 · 3942 阅读 · 2 评论