mysharespaces-CSDN博客

原创 weka简单实例

1.交叉验证J48设置流以加载ARFF文件（批处理模式），并使用J48（WEKA的C4.5实现）执行交叉验证。•单击DataSources选项卡，从工具栏中选择ArffLoader（鼠标指针将变为十字线）。•接下来，通过单击布局上的某处（ArffLoader图标的副本将出现在布局区域上），将ArffLoader组件放置在布局区域上。•下一个指定要加载的ARFF文件，首先右键

2017-01-23 13:18:17 5765

原创 weka界面介绍

KnowledgeFlow提供了一个替代资源管理器作为WEKA核心算法的图形前端。知识流是一个正在进行中的工作，所以从资源管理器的一些功能尚不可用。另一方面，有些事情可以在KnowledgeFlow中完成，但不能在Explorer中完成。 KnowledgeFlow向WEKA提供了一个数据流灵感接口。用户可以从工具栏中选择WEKA组件，将它们放置在布局栏上，并将它们连接在一起

2017-01-23 13:17:11 2116

原创 docker

一、docker简介什么是容器？一种虚拟化方案操作系统级别的虚拟化只能运行相同或相似内核的操作系统依赖于linux内核特性：namespace和cgroups（control group）docker：开源的容器虚拟化平台docker hub：用于分享、管理docker容器的docker saas平台 -- docker hub

2017-01-23 10:29:36 547

原创 kylin

Apache Kylin是一个开源的分布式分析引擎。完全由eBay Inc.中国团队开发并贡献至开源社区。提供Hadoop之上的SQL查询接口及多维分析（MOLAP）能力以支持大规模数据能在亚秒内查询巨大的Hive表(十亿百亿的海量数据)。Apache Kylin社区发展大数据分析面临的挑战Huge volume dataTable scan

2017-01-23 13:31:56 2010

原创搭建一个简单的Docker应用栈

一，启动应用栈容器获取应用栈各节点所需镜像docker pull ubuntudocker pull djangodocker pull haproxydocker pull redisdocker images容器启动顺序为：redis-masterredis-slaveapphaproxy应用栈容器节点启动启动redis容器d

2017-01-23 13:29:30 1527

原创 pentaho7.0安装配置（四）

编辑\biserver-ce\tomcat\webapps\pentaho\META-INF\context.xml Context path="/pentaho" docbase="webapps/pentaho/"> factory="org.apache.commons.dbcp.BasicDataSourceFactory" maxActive="20" maxIdl

2017-01-23 11:32:32 1455

原创 pentaho7.0安装配置（六）

编辑这里的IP，可以开放允许外部访问 context-param> param-name>fully-qualified-server-urlparam-name> param-value>http://localhost:8080/pentaho/param-value> context-param>复制mysql的驱动包到\biserver-ce\tomcat\we

2017-01-23 11:26:16 2205

原创 pentaho7.0安装配置（五）

编辑\biserver-ce\tomcat\webapps\pentaho\META-INF\context.xml Context path="/pentaho" docbase="webapps/pentaho/"> factory="org.apache.commons.dbcp.BasicDataSourceFactory" maxActive="20" maxId

2017-01-23 11:20:11 1601

原创 pentaho7.0安装配置（三）

点[Login as an Evaluator]就可以看到用户名和密码点任意一个[Go]就能登陆主页面了尽管bi Server启动但是数据库我们希望能够连上一些常用数据库，比如MySQL 修改数据库连接，使用Ｍysql 1.将下列文件夹中的SQL脚本导入mysql create_repository_mysql.sql 创建hibernate 数据库，用于存储用户授权认证，so

2017-01-23 11:18:51 1585

原创 docker入门操作

运行第一个容器docker run -i -t ubuntu /bin/bash使用第一个容器检查容器的主机名：hostnamecat /etc/hostsip a检查容器的进程 ps -aux在第一个容器中安装软件包apt-get update && apt-get install vimdocker ps -a容器命名 docker run --name

2017-01-23 11:07:48 408

原创 pentaho7.0安装配置（二）

所以打开浏览器输入，http://localhost:8080/pentaho 点[Login as an Evaluator]就可以看到用户名和密码点任意一个[Go]就能登陆主页面了尽管bi Server启动但是数据库我们希望能够连上一些常用数据库，比如MySQL修改数据库连接，使用Ｍysql1.将下列文件夹中的SQL脚本导入mysql create_reposi

2017-01-23 10:59:17 2424

原创 pentaho7.0安装配置（一）

pentaho : pentaho-server-ce-7.0.0.0-25MYSQL : 5.1.71 JDK : 1.8OS : centos 6.5 第一次启动1.先把下载得到的压缩包解压缩到任意位置2.设置环境变量3.启动Server启动成功，但是在启动日志里发现使用的是HSQLDB先看看成功启动之后的Server界面。因为BI Server里内置了tomcat

2016-12-08 15:11:19 4302

关于 Ambari 的安装，目前网上能找到两个发行版，一个是 Apache 的 Ambari，另一个是 Hortonworks 的，两者区别不大。这里就以 Apache 的 Ambari 2.0.1 作为示例。本文使用三台 centos 6.5 作为安装环境（目前测试验证结果为 Ambari 在 centos 6.5 的版本上运行比较稳定），五台机器分别为 hadoop1、hadoop2、hado

2016-12-02 10:50:28 1012

原创任务调度器之azkaban（二）

Azkaban安装部署在2.5版本之后，Azkaban提供了两种模式来安装：一种是standalone的“solo-server”模式；另一种是两个server的模式，分别为AzkabanWebServer和AzkabanExecutorServer 两个server的模式：准备工作 Azkaban Web服务器 azkaban-web-server-3.1.0.tar.gz A

2016-11-22 16:00:17 2795

原创任务调度器之azkaban（一）

最近公司有用到azkaban，参考一些资料来分享下。市面上目前有许多工作流调度器在hadoop领域，常见的工作流调度器有Oozie,Azkaban,Cascading,Hamake等。各种调度工具特性对比下面的表格对上述四种调度器的关键特性进行了比较，尽管这些工作流调度器能够解决的需求场景基本一致，但在设计理念，目标用户，应用场景等方面还是存在显著的区别。 Azkaban介绍

2016-11-22 15:05:02 1663

原创 FlumeNG

Flume是什么？收集、聚合事件流数据的分布式框架通常用于log数据采用ad-hoc方案，有如下优点: 可靠的、可伸缩、可管理、可定制、高性能声明式配置，可以动态更新配置提供上下文路由功能支持负载均衡和故障转移功能丰富完全的可扩展数据收集的框架Flume的data flowdata flow描

2016-09-26 16:00:28 515

原创 hadoop整理笔记

1. HADOOP背景介绍1.1 什么是HADOOP1.HADOOP是apache旗下的一套开源软件平台2.HADOOP提供的功能：利用服务器集群，根据用户的自定义业务逻辑，对海量数据进行分布式处理3.HADOOP的核心组件有A.HDFS（分布式文件系统）B.YARN（运算资源调度系统）C.MAPREDUCE（分布式运算编程框架）4.广义上来说，HADOOP通常是指

2016-09-26 15:30:28 534

原创三大框架学习心得

一、框架概述1、框架的意义与作用：所谓框架，就是把一些繁琐的重复性代码封装起来，使程序员在编码中把更多的经历放到业务需求的分析和理解上面。特点：封装了很多细节，程序员在使用的时候会非常简单。2、三大框架：Struts2，Hibernate，Spring3、学好框架：由于框架中细节很多，知识点比较零散，课后总结和做好笔记就变得尤为重要。二、关于三层架构三、

2016-08-22 10:41:31 6655

y878759487的博客