数据挖掘
软工小透明
找个wlb的工作,做自己感兴趣的事情,人生才有意义
展开
-
数据仓库(一):数据仓库概述
数据仓库概述1.数据仓库需要解决的问题以及需要达成的目标跨系统实现数据共享,解决信息孤岛问题,提升数据质量现在很多企业都有很多业务,每种类型的业务可能都有一个系统应用来支撑,但各个业务系统之间相互独立,比如A系统只有A类型业务的数据,B系统只有B类型业务的数据,A,B系统由于权限等各种问题不能互相访问彼此的数据,所以跨系统实现数据共享解决信息孤岛问题很重要构建企业单一视图,实现各种结...原创 2019-11-12 22:52:22 · 377 阅读 · 0 评论 -
java代码实现将无表头.txt文本文件转化为weka能识别.arff文件
首先,我们要有一个.txt文件,每一行中的元素个数是相同的(因为每一行中的每一个元素就代表了一种类型的属性值),文尾已奉上,读者自行下载。有的就不用下载了,然后,,,代码如下,具体的就不细讲了import java.io.*;import java.util.ArrayList;/** * Created by Administrator on 2016/10/20. */原创 2016-10-20 13:05:38 · 2411 阅读 · 0 评论 -
java代码实现将时间序列数据集(UCR)转化为weka能识别的.arff文件
之前发过一篇转.arff文件的博客,后来发现是错的。。。,weka虽然能识别,但是并不能进行聚类或者分类,原因是我没有提取数据集中的类别信息,也就是说我将其中的类标也看成一个属性了。。。而且为了方便转换,做了一个再简单不过的界面,(主要是需要转换的文件太多了,不想一个一个改路径。。。)如下图,直接选中就可以转换了:第一个显示你要选择的文件,第二个显示你是否转换成功。原创 2016-12-28 23:34:21 · 2691 阅读 · 1 评论 -
weka之如何利用kmeans算法分析数据的聚类效果
聚类算法之k-means算法的数据集分析:1. K均值聚类的步骤:K均值算法首先随机的指定K个簇中心。然后:1)将每个实例分配到距它最近的簇中心,得到K个簇;2)计分别计算各簇中所有实例的均值,把它们作为各簇新的簇中心。重复1)和2)不断迭代,直到K个簇中心的位置都固定,簇的分配也固定。原创 2017-09-16 21:12:21 · 26159 阅读 · 2 评论