- 博客(11)
- 资源 (1)
- 收藏
- 关注
原创 Pentaho Mondrian
OLAP应用是目前数据仓库上的重要应用之一,是决策分析的关键。作为数据仓库最重要的多维分析工具。本文就OLAP的基本概念,OLAP引擎-Mondrian的体系结构进行讨论。 select {[Measures].[Salary]} on columns, [Employee].[employeeId].members on rows from
2013-08-30 14:27:54 1365
原创 Pentaho
Pentaho是宽开源的BI,主要包含以下一些模块:1) Kettle(Pentaho Data Integration,PDI),它是款以元数据驱动方式实现的ETL工具,支持拖拽操作和图形显示。2) BI Platform(Pentaho BI Platform and Server),它提供BI构架和解决方案所需的基础,该框架提供的核心服务包括身份验证、日志、审核、网络服务和规则引擎
2013-08-30 11:01:58 975
原创 OLAP
1、联机分析处理 (OLAP) 的概念最早是由关系数据库之父E.F.Codd于1993年提出的,他同时提出了关于OLAP的12条准则。OLAP的提出引起了很大的反响,OLAP作为一类产品同联机事务处理 (OLTP) 明显区分开来。2、当今的数据处理大致可以分成两大类:联机事务处理OLTP(on-line transaction processing)、联机分析处理OLAP(On-Line An
2013-08-30 10:09:36 873
原创 兴趣度度量规则
首先我们来温习一下Apriori的有关知识。对于一条关联规则L->R,我们常用支持度(Support)和置信度(Confidence)来衡 量它的重要性。规则的支持度是用来估计在一个购物篮中同时观察到L和R的概率P(L,R),而规则的置信度是估计购物栏中出现了L时也出会现R的条件概率 P(R|L)。关联规则的目标一般是产生支持度和置信度都较高的规则。 有几个类似的度量代替置信度来衡量规则的
2013-08-29 14:18:53 5312
原创 weka中对数值型数据离散化
连续数值离散化大致可分为:1)有监督(supervised)和2)无监督(unsupervised)两类。有监督方法可通过设定类别相关目标函数如:分类错误率,熵增益等指标结合二叉树算法对特征空间进行划分。这类方法的核心思想就是是每类样本尽量分布在特征空间中的不同子划分中。 无监督方法由于没有考虑类别信息,因此其核心思想是使得每个子划分空间的样本分布尽量均匀,具体可以采用等间隔、等密度或
2013-08-29 14:14:09 9868 2
原创 mysql使用
往mysql中导入一个百兆的sql脚本,都好慢啊,有空得学学用java代码成批导入怎么弄,下去写了一段,有错,然后就没再写了,贴一下先;package cc;import java.io.BufferedReader;import java.io.FileReader;import java.sql.Connection;import java.sql.DriverMa
2013-08-28 18:45:51 565
原创 weka使用
经过这两天weka的使用,发现:1,各种方法必须在打开一个文件之后才能使用,而且这个文件是arff类型的;2,weka的association中的Apriori等方法是不支持数值类型的,所以文件中有数值类型的时候,应该先在preprocess里离散化,例如,如果你选bins=3,就是取两个值a,b,(不知道weka是怎么取这两个值得),然后它把数据给你分成三段,“-inf到a”,"a,b"
2013-08-28 18:42:52 845
原创 weka的重新编译和添加算法
weka的重新编译与添加算法weka源码编译步骤1 安装JDK环境和Java开发环境,例如Eclipse。2 安装WEKA(安装不带JRE的WEKA即可)。3 重新编译:3.1 创建工作目录。新建任意一目录在任意位置(在Eclipse的workspace中或桌面,打开myeclipse时选该文件夹即可
2013-08-28 18:35:55 2318
原创 weka怎么把csv文件转化成arff文件
ARFF文件是Weka默认的储存数据集文件。每个ARFF文件对应一个二维表格。表格的各行是数据集的各实例,各列是数据集的各个属性。下面是Weka自带的“weather.arff”文件,在Weka安装目录的“data”子目录下可以找到。 需要注意的是,在Windows记事本打开这个文件时,可能会因为回车符定义不一致而导致分行不正常。推荐使用UltraEdit这样的字符编辑软件察看ARFF
2013-08-28 18:30:37 14477
转载 weka安装和配置
一、WEKA的安装在WEKA的安装文件中有weka-3-5-7.exe和weka-3-5-7jre.exe,这两个软件我们安装一个即可,它们的区别是weka-3-5-6.exe只安装WEKA,而weka-3-5-7jre.exe是将WEKA和JRE一起安装,所以在安装之前我们应该首先检查一下我们的电脑中是否安装了JRE,如果本机中已经安装了JRE,那么我们就选择weka-3-5-6.exe
2013-08-28 18:24:48 1795
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人