自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 weka简单实例

1.交叉验证J48 设置流以加载ARFF文件(批处理模式),并使用J48(WEKA的C4.5实现)执行交叉验证。 •单击DataSources选项卡,从工具栏中选择ArffLoader(鼠标指针将变为十字线)。 •接下来,通过单击布局上的某处(ArffLoader图标的副本将出现在布局区域上),将ArffLoader组件放置在布局区域上。 •下一个指定要加载的ARFF文件,首先右键

2017-01-23 13:18:17 5511 1

原创 weka界面介绍

KnowledgeFlow提供了一个替代资源管理器作为WEKA核心算法的图形前端。知识流是一个正在进行中的工作,所以从资源管理器的一些功能尚不可用。另一方面,有些事情可以在KnowledgeFlow中完成,但不能在Explorer中完成。         KnowledgeFlow向WEKA提供了一个数据流灵感接口。用户可以从工具栏中选择WEKA组件,将它们放置在布局栏上,并将它们连接在一起

2017-01-23 13:17:11 1957

原创 docker

一、docker简介 什么是容器? 一种虚拟化方案 操作系统级别的虚拟化 只能运行相同或相似内核的操作系统 依赖于linux内核特性:namespace和cgroups(control group) docker:开源的容器虚拟化平台 docker hub:用于分享、管理docker容器的docker saas平台 -- docker hub

2017-01-23 10:29:36 488

原创 kylin

Apache Kylin是一个开源的分布式分析引擎。完全由eBay Inc.中国团队开发 并贡献至开源社区。提供Hadoop之上的SQL查询接口及多维分析(MOLAP)能力以 支持大规模数据能在亚秒内查询巨大的Hive表(十亿百亿的海量数据)。 Apache Kylin社区发展 大数据分析面临的挑战 Huge volume data Table scan

2017-01-23 13:31:56 1917

原创 搭建一个简单的Docker应用栈

一,启动应用栈容器 获取应用栈各节点所需镜像 docker pull ubuntu docker pull django docker pull haproxy docker pull redis docker images 容器启动顺序为: redis-master redis-slave app haproxy 应用栈容器节点启动 启动redis容器 d

2017-01-23 13:29:30 1416

原创 pentaho7.0安装配置 (四)

编辑 \biserver-ce\tomcat\webapps\pentaho\META-INF\context.xml Context path="/pentaho" docbase="webapps/pentaho/"> factory="org.apache.commons.dbcp.BasicDataSourceFactory" maxActive="20" maxIdl

2017-01-23 11:32:32 1400

原创 pentaho7.0安装配置 (六)

编辑 这里的IP,可以开放允许外部访问  context-param> param-name>fully-qualified-server-urlparam-name> param-value>http://localhost:8080/pentaho/param-value> context-param> 复制mysql的驱动包到 \biserver-ce\tomcat\we

2017-01-23 11:26:16 2122

原创 pentaho7.0安装配置 (五)

编辑 \biserver-ce\tomcat\webapps\pentaho\META-INF\context.xml Context path="/pentaho" docbase="webapps/pentaho/"> factory="org.apache.commons.dbcp.BasicDataSourceFactory" maxActive="20" maxId

2017-01-23 11:20:11 1546

原创 pentaho7.0安装配置 (三)

点[Login as an Evaluator]就可以看到用户名和密码 点任意一个[Go]就能登陆主页面了 尽管bi Server启动但是数据库我们希望能够连上一些常用数据库,比如MySQL 修改数据库连接,使用Mysql 1.将下列文件夹中的SQL脚本导入mysql create_repository_mysql.sql 创建hibernate 数据库,用于存储用户授权认证,so

2017-01-23 11:18:51 1503

原创 docker入门操作

运行第一个容器 docker run -i -t ubuntu /bin/bash 使用第一个容器 检查容器的主机名:hostname cat /etc/hosts ip a 检查容器的进程 ps -aux 在第一个容器中安装软件包 apt-get update && apt-get install vim docker ps -a 容器命名 docker run --name

2017-01-23 11:07:48 356

原创 pentaho7.0安装配置 (二)

所以打开浏览器输入,http://localhost:8080/pentaho   点[Login as an Evaluator]就可以看到用户名和密码 点任意一个[Go]就能登陆主页面了   尽管bi Server启动但是数据库我们希望能够连上一些常用数据库,比如MySQL 修改数据库连接,使用Mysql 1.将下列文件夹中的SQL脚本导入mysql  create_reposi

2017-01-23 10:59:17 2351

原创 pentaho7.0安装配置(一)

pentaho : pentaho-server-ce-7.0.0.0-25 MYSQL : 5.1.71 JDK : 1.8 OS : centos 6.5 第一次启动 1.先把下载得到的压缩包解压缩到任意位置 2.设置环境变量 3.启动Server 启动成功,但是在启动日志里发现使用的是HSQLDB 先看看成功启动之后的Server界面。 因为BI Server里内置了tomcat

2016-12-08 15:11:19 4192 2

原创 ambari部署

关 于 Ambari 的安装,目前网上能找到两个发行版,一个是 Apache 的 Ambari,另一个是 Hortonworks 的,两者区别不大。这里就以 Apache 的 Ambari 2.0.1 作为示例。本文使用三台 centos 6.5 作为安装环境(目前测试验证结果为 Ambari 在 centos 6.5 的版本上运行比较稳定),五台机器分别为 hadoop1、hadoop2、hado

2016-12-02 10:50:28 919

原创 任务调度器之azkaban(二)

Azkaban安装部署 在2.5版本之后,Azkaban提供了两种模式来安装: 一种是standalone的“solo-server”模式;另一种是两个server的模式,分别为AzkabanWebServer和AzkabanExecutorServer 两个server的模式: 准备工作 Azkaban Web服务器 azkaban-web-server-3.1.0.tar.gz A

2016-11-22 16:00:17 2713

原创 任务调度器之azkaban(一)

最近公司有用到azkaban,参考一些资料来分享下。 市面上目前有许多工作流调度器 在hadoop领域,常见的工作流调度器有Oozie,Azkaban,Cascading,Hamake等。 各种调度工具特性对比 下面的表格对上述四种调度器的关键特性进行了比较,尽管这些工作流调度器能够解决的需求场景基本一致,但在设计理念,目标用户,应用场景等方面还是存在显著的区别。 Azkaban介绍

2016-11-22 15:05:02 1560

原创 FlumeNG

Flume是什么? 收集、聚合事件流数据的分布式框架 通常用于log数据 采用ad-hoc方案,有如下优点:      可靠的、可伸缩、可管理、可定制、高性能      声明式配置,可以动态更新配置      提供上下文路由功能      支持负载均衡和故障转移      功能丰富      完全的可扩展 数据收集的框架 Flume的data flow data flow描

2016-09-26 16:00:28 447

原创 hadoop整理笔记

1. HADOOP背景介绍 1.1 什么是HADOOP 1.HADOOP是apache旗下的一套开源软件平台 2.HADOOP提供的功能:利用服务器集群,根据用户的自定义业务逻辑,对海量数据进行分布式处理 3.HADOOP的核心组件有 A.HDFS(分布式文件系统) B.YARN(运算资源调度系统) C.MAPREDUCE(分布式运算编程框架) 4.广义上来说,HADOOP通常是指

2016-09-26 15:30:28 482

原创 三大框架学习心得

一、框架概述 1、框架的意义与作用: 所谓框架,就是把一些繁琐的重复性代码封装起来,使程序员在编码中把更多的经历放到业务需求的分析和理解上面。 特点:封装了很多细节,程序员在使用的时候会非常简单。 2、三大框架: Struts2,Hibernate,Spring 3、学好框架: 由于框架中细节很多,知识点比较零散,课后总结和做好笔记就变得尤为重要。 二、关于三层架构 三、

2016-08-22 10:41:31 6502

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除