- 博客(18)
- 收藏
- 关注
原创 weka简单实例
1.交叉验证J48 设置流以加载ARFF文件(批处理模式),并使用J48(WEKA的C4.5实现)执行交叉验证。 •单击DataSources选项卡,从工具栏中选择ArffLoader(鼠标指针将变为十字线)。 •接下来,通过单击布局上的某处(ArffLoader图标的副本将出现在布局区域上),将ArffLoader组件放置在布局区域上。 •下一个指定要加载的ARFF文件,首先右键
2017-01-23 13:18:17 5511 1
原创 weka界面介绍
KnowledgeFlow提供了一个替代资源管理器作为WEKA核心算法的图形前端。知识流是一个正在进行中的工作,所以从资源管理器的一些功能尚不可用。另一方面,有些事情可以在KnowledgeFlow中完成,但不能在Explorer中完成。 KnowledgeFlow向WEKA提供了一个数据流灵感接口。用户可以从工具栏中选择WEKA组件,将它们放置在布局栏上,并将它们连接在一起
2017-01-23 13:17:11 1957
原创 docker
一、docker简介 什么是容器? 一种虚拟化方案 操作系统级别的虚拟化 只能运行相同或相似内核的操作系统 依赖于linux内核特性:namespace和cgroups(control group) docker:开源的容器虚拟化平台 docker hub:用于分享、管理docker容器的docker saas平台 -- docker hub
2017-01-23 10:29:36 488
原创 kylin
Apache Kylin是一个开源的分布式分析引擎。完全由eBay Inc.中国团队开发 并贡献至开源社区。提供Hadoop之上的SQL查询接口及多维分析(MOLAP)能力以 支持大规模数据能在亚秒内查询巨大的Hive表(十亿百亿的海量数据)。 Apache Kylin社区发展 大数据分析面临的挑战 Huge volume data Table scan
2017-01-23 13:31:56 1917
原创 搭建一个简单的Docker应用栈
一,启动应用栈容器 获取应用栈各节点所需镜像 docker pull ubuntu docker pull django docker pull haproxy docker pull redis docker images 容器启动顺序为: redis-master redis-slave app haproxy 应用栈容器节点启动 启动redis容器 d
2017-01-23 13:29:30 1416
原创 pentaho7.0安装配置 (四)
编辑 \biserver-ce\tomcat\webapps\pentaho\META-INF\context.xml Context path="/pentaho" docbase="webapps/pentaho/"> factory="org.apache.commons.dbcp.BasicDataSourceFactory" maxActive="20" maxIdl
2017-01-23 11:32:32 1400
原创 pentaho7.0安装配置 (六)
编辑 这里的IP,可以开放允许外部访问 context-param> param-name>fully-qualified-server-urlparam-name> param-value>http://localhost:8080/pentaho/param-value> context-param> 复制mysql的驱动包到 \biserver-ce\tomcat\we
2017-01-23 11:26:16 2122
原创 pentaho7.0安装配置 (五)
编辑 \biserver-ce\tomcat\webapps\pentaho\META-INF\context.xml Context path="/pentaho" docbase="webapps/pentaho/"> factory="org.apache.commons.dbcp.BasicDataSourceFactory" maxActive="20" maxId
2017-01-23 11:20:11 1546
原创 pentaho7.0安装配置 (三)
点[Login as an Evaluator]就可以看到用户名和密码 点任意一个[Go]就能登陆主页面了 尽管bi Server启动但是数据库我们希望能够连上一些常用数据库,比如MySQL 修改数据库连接,使用Mysql 1.将下列文件夹中的SQL脚本导入mysql create_repository_mysql.sql 创建hibernate 数据库,用于存储用户授权认证,so
2017-01-23 11:18:51 1503
原创 docker入门操作
运行第一个容器 docker run -i -t ubuntu /bin/bash 使用第一个容器 检查容器的主机名:hostname cat /etc/hosts ip a 检查容器的进程 ps -aux 在第一个容器中安装软件包 apt-get update && apt-get install vim docker ps -a 容器命名 docker run --name
2017-01-23 11:07:48 356
原创 pentaho7.0安装配置 (二)
所以打开浏览器输入,http://localhost:8080/pentaho 点[Login as an Evaluator]就可以看到用户名和密码 点任意一个[Go]就能登陆主页面了 尽管bi Server启动但是数据库我们希望能够连上一些常用数据库,比如MySQL 修改数据库连接,使用Mysql 1.将下列文件夹中的SQL脚本导入mysql create_reposi
2017-01-23 10:59:17 2351
原创 pentaho7.0安装配置(一)
pentaho : pentaho-server-ce-7.0.0.0-25 MYSQL : 5.1.71 JDK : 1.8 OS : centos 6.5 第一次启动 1.先把下载得到的压缩包解压缩到任意位置 2.设置环境变量 3.启动Server 启动成功,但是在启动日志里发现使用的是HSQLDB 先看看成功启动之后的Server界面。 因为BI Server里内置了tomcat
2016-12-08 15:11:19 4192 2
原创 ambari部署
关 于 Ambari 的安装,目前网上能找到两个发行版,一个是 Apache 的 Ambari,另一个是 Hortonworks 的,两者区别不大。这里就以 Apache 的 Ambari 2.0.1 作为示例。本文使用三台 centos 6.5 作为安装环境(目前测试验证结果为 Ambari 在 centos 6.5 的版本上运行比较稳定),五台机器分别为 hadoop1、hadoop2、hado
2016-12-02 10:50:28 919
原创 任务调度器之azkaban(二)
Azkaban安装部署 在2.5版本之后,Azkaban提供了两种模式来安装: 一种是standalone的“solo-server”模式;另一种是两个server的模式,分别为AzkabanWebServer和AzkabanExecutorServer 两个server的模式: 准备工作 Azkaban Web服务器 azkaban-web-server-3.1.0.tar.gz A
2016-11-22 16:00:17 2713
原创 任务调度器之azkaban(一)
最近公司有用到azkaban,参考一些资料来分享下。 市面上目前有许多工作流调度器 在hadoop领域,常见的工作流调度器有Oozie,Azkaban,Cascading,Hamake等。 各种调度工具特性对比 下面的表格对上述四种调度器的关键特性进行了比较,尽管这些工作流调度器能够解决的需求场景基本一致,但在设计理念,目标用户,应用场景等方面还是存在显著的区别。 Azkaban介绍
2016-11-22 15:05:02 1560
原创 FlumeNG
Flume是什么? 收集、聚合事件流数据的分布式框架 通常用于log数据 采用ad-hoc方案,有如下优点: 可靠的、可伸缩、可管理、可定制、高性能 声明式配置,可以动态更新配置 提供上下文路由功能 支持负载均衡和故障转移 功能丰富 完全的可扩展 数据收集的框架 Flume的data flow data flow描
2016-09-26 16:00:28 447
原创 hadoop整理笔记
1. HADOOP背景介绍 1.1 什么是HADOOP 1.HADOOP是apache旗下的一套开源软件平台 2.HADOOP提供的功能:利用服务器集群,根据用户的自定义业务逻辑,对海量数据进行分布式处理 3.HADOOP的核心组件有 A.HDFS(分布式文件系统) B.YARN(运算资源调度系统) C.MAPREDUCE(分布式运算编程框架) 4.广义上来说,HADOOP通常是指
2016-09-26 15:30:28 482
原创 三大框架学习心得
一、框架概述 1、框架的意义与作用: 所谓框架,就是把一些繁琐的重复性代码封装起来,使程序员在编码中把更多的经历放到业务需求的分析和理解上面。 特点:封装了很多细节,程序员在使用的时候会非常简单。 2、三大框架: Struts2,Hibernate,Spring 3、学好框架: 由于框架中细节很多,知识点比较零散,课后总结和做好笔记就变得尤为重要。 二、关于三层架构 三、
2016-08-22 10:41:31 6502
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人