自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (1)
  • 收藏
  • 关注

原创 Pentaho Mondrian

OLAP应用是目前数据仓库上的重要应用之一,是决策分析的关键。作为数据仓库最重要的多维分析工具。本文就OLAP的基本概念,OLAP引擎-Mondrian的体系结构进行讨论。      select {[Measures].[Salary]} on columns,   [Employee].[employeeId].members on rows from 

2013-08-30 14:27:54 1365

原创 Pentaho

Pentaho是宽开源的BI,主要包含以下一些模块:1) Kettle(Pentaho Data Integration,PDI),它是款以元数据驱动方式实现的ETL工具,支持拖拽操作和图形显示。2)  BI Platform(Pentaho BI Platform and Server),它提供BI构架和解决方案所需的基础,该框架提供的核心服务包括身份验证、日志、审核、网络服务和规则引擎

2013-08-30 11:01:58 975

原创 OLAP

1、联机分析处理 (OLAP) 的概念最早是由关系数据库之父E.F.Codd于1993年提出的,他同时提出了关于OLAP的12条准则。OLAP的提出引起了很大的反响,OLAP作为一类产品同联机事务处理 (OLTP) 明显区分开来。2、当今的数据处理大致可以分成两大类:联机事务处理OLTP(on-line transaction processing)、联机分析处理OLAP(On-Line An

2013-08-30 10:09:36 873

原创 兴趣度度量规则

首先我们来温习一下Apriori的有关知识。对于一条关联规则L->R,我们常用支持度(Support)和置信度(Confidence)来衡 量它的重要性。规则的支持度是用来估计在一个购物篮中同时观察到L和R的概率P(L,R),而规则的置信度是估计购物栏中出现了L时也出会现R的条件概率 P(R|L)。关联规则的目标一般是产生支持度和置信度都较高的规则。 有几个类似的度量代替置信度来衡量规则的

2013-08-29 14:18:53 5312

原创 weka中对数值型数据离散化

连续数值离散化大致可分为:1)有监督(supervised)和2)无监督(unsupervised)两类。有监督方法可通过设定类别相关目标函数如:分类错误率,熵增益等指标结合二叉树算法对特征空间进行划分。这类方法的核心思想就是是每类样本尽量分布在特征空间中的不同子划分中。 无监督方法由于没有考虑类别信息,因此其核心思想是使得每个子划分空间的样本分布尽量均匀,具体可以采用等间隔、等密度或

2013-08-29 14:14:09 9868 2

原创 sql脚本

下了一个UltraEdit,可以不换行的打开文件;当然是在源文件不换行的时候~\(≧▽≦)/~啦啦啦

2013-08-28 18:48:20 612

原创 mysql使用

往mysql中导入一个百兆的sql脚本,都好慢啊,有空得学学用java代码成批导入怎么弄,下去写了一段,有错,然后就没再写了,贴一下先;package cc;import java.io.BufferedReader;import java.io.FileReader;import java.sql.Connection;import java.sql.DriverMa

2013-08-28 18:45:51 565

原创 weka使用

经过这两天weka的使用,发现:1,各种方法必须在打开一个文件之后才能使用,而且这个文件是arff类型的;2,weka的association中的Apriori等方法是不支持数值类型的,所以文件中有数值类型的时候,应该先在preprocess里离散化,例如,如果你选bins=3,就是取两个值a,b,(不知道weka是怎么取这两个值得),然后它把数据给你分成三段,“-inf到a”,"a,b"

2013-08-28 18:42:52 845

原创 weka的重新编译和添加算法

weka的重新编译与添加算法weka源码编译步骤1           安装JDK环境和Java开发环境,例如Eclipse。2           安装WEKA(安装不带JRE的WEKA即可)。3           重新编译:3.1          创建工作目录。新建任意一目录在任意位置(在Eclipse的workspace中或桌面,打开myeclipse时选该文件夹即可

2013-08-28 18:35:55 2318

原创 weka怎么把csv文件转化成arff文件

ARFF文件是Weka默认的储存数据集文件。每个ARFF文件对应一个二维表格。表格的各行是数据集的各实例,各列是数据集的各个属性。下面是Weka自带的“weather.arff”文件,在Weka安装目录的“data”子目录下可以找到。 需要注意的是,在Windows记事本打开这个文件时,可能会因为回车符定义不一致而导致分行不正常。推荐使用UltraEdit这样的字符编辑软件察看ARFF

2013-08-28 18:30:37 14477

转载 weka安装和配置

一、WEKA的安装在WEKA的安装文件中有weka-3-5-7.exe和weka-3-5-7jre.exe,这两个软件我们安装一个即可,它们的区别是weka-3-5-6.exe只安装WEKA,而weka-3-5-7jre.exe是将WEKA和JRE一起安装,所以在安装之前我们应该首先检查一下我们的电脑中是否安装了JRE,如果本机中已经安装了JRE,那么我们就选择weka-3-5-6.exe

2013-08-28 18:24:48 1795

Weka系统中的关联规则

weka系统中的管理啊规则,lift,leverage,confidence,等等兴趣度度量规则解释和定义

2013-08-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除