CentOS 7.3上图数据库Neo4j的安装和测试

本文档将介绍在CentOS 7.3上部署图数据库Neo4j,包括使用Python访问Neo4j图数据库。 步骤一:安装JDK(略) 步骤二:安装Python 2.7版本[root@openstack-node1 tmp]# python -VPython 2.7.5 步骤三:安装neo4j[root@openstack-node1 tmp]# cd /tmp[root@openstack-node...
阅读(356) 评论(0)

HDFS配额设置和测试

名称配额(Name Quota)名称配额是在对应的目录下所有文件和目录名称的数量上的限制。当超过这个配额的时候,文件或目录就会创建失败,重命名后名称配额仍然有效。因为比较简单,所以我们直接测试:步骤一:创建一个测试目录[root@testbig1 ~]# hdfs dfs -mkdir /data/test_quota1 步骤二:设置创建的目录的名称配额[root@testbig1 ~]# hdf...
阅读(146) 评论(0)

Zeppelin集成LDAP的部署和实践

环境信息:Zeppelin版本:0.7.0Kylin版本:1.6.0 Zeppelin部署:1.      修改$ZEPPELIN_HOME/conf/shiro.ini文件,配置Zeppelin集成LDAP:### A sample for configuring LDAP DirectoryRealmldapRealm = org.apache.zeppelin.realm.LdapGroup...
阅读(1092) 评论(8)

基于Hadoop开源组件部署Kylin分析平台

说明:不少读者反馈,想使用开源组件搭建Hadoop平台,然后再部署Kylin,但是遇到各种问题。这里我为读者部署一套环境,请朋友们参考一下。如果还有问题,再交流。系统环境以及各组件版本信息Linux操作系统:# cat /etc/redhat-release CentOS Linux release 7.2.1511 (Core) JDK版本:# java -versionjava version...
阅读(605) 评论(0)

CentOS 7.2部署MariaDB Galera Cluster(10.1.21-MariaDB) 3主集群环境

MariaDB Galera Cluster 介绍Galera Cluster是由第三方公司Codership所研发的一套免费开源的集群高可用方案,实现了数据零丢失,官网地址为http://galeracluster.com/。其在MySQLInnoDB存储引擎基础上打了wrep(虚拟全同步复制),Percona/MariaDB已捆绑在各自的发行版本中。 MariaDB Galera Cluste...
阅读(969) 评论(0)

CentOS 7.2部署MariaDB主从复制架构

MariaDB主从复制MySQL的二进制日志(binglog)会记录所有对数据库进行更改的操作,也就是说只要是会对数据库产生修改的操作都会被记录到二进制日志中去。记录二进制日志的主要目的有两方面:1.      恢复2.      复制 MySQL的复制就是基于二进制日志而完成的,其工作原理如下:当MySQL的Master节点的数据有更改的时候,Master会主动通知Slave,让Slave主动来...
阅读(309) 评论(0)

Apache Kylin v2.0.0 beta 发布(来自官网)

Apache Kylin社区非常高兴地宣布 v2.0.0 beta package 已经可以下载并测试了。下载链接: http://kylin.apache.org/cn/download/源代码: https://github.com/apache/kylin/tree/kylin-2.0.0-beta自从v1.6.0版本发布已经2个多月了。这段时间里,整个社区协力开发完成了一系列重大的功能,希...
阅读(305) 评论(0)

Kylin 1.6.0进行Streaming Cube构建时的问题总结

在使用Kylin从Kafka来进行Streaming Cubing时,构建过程中出现如下错误: 从这个步骤的日志中简单显示:killed by admin 如果无法知道具体原因,那么我们可以从Yarn的作业中来查看: 进入到MR作业中,查看具体日志为:MAP capability required is more than thesupported max container capability...
阅读(606) 评论(0)

基于Cloudera Manager配置Impala的资源管理

Impala包含一些特性,可以在CDH集群中平衡和最大化资源。本章将说明如何使用Impala提升CDH集群的利用效率。 创建静态服务池使用静态服务池可以给Impala和其他服务分配专用的资源,以考虑到预计的资源需求。 静态服务池将服务彼此隔离开来,因此一个高负载的服务对其他服务的影响是有限的。你可以使用CM来配置静态服务池,控制内存,CPU和磁盘I/O。 l  HDFS通常最少需要5-10%的资源...
阅读(718) 评论(0)

《基于Apache Kylin构建大数据分析平台》

自2011年下半年开始,我就一直关注Apache开源社区,侧重点放在大数据方面的成熟框架和产品。在这期间,陆续研究过Hadoop、Hive、HBase、Mahout、Kafka、Flume、Storm,以及近两年很火的Spark和Flink等,和很多从事大数据的朋友一样,经历过无数的夜晚,对着电脑屏幕逐行研究这些源代码,同时也看到无数的开源爱好者和技术专家加入Hadoop开源社区,贡献自己的力量,...
阅读(2179) 评论(0)

Apache Kylin高级部分之使用Hive视图

本章节我们将介绍为什么需要在Kylin创建Cube过程中使用Hive视图;而如果使用Hive视图,能够带来什么好处,解决什么样的问题;以及需要学会如何使用视图,使用视图有什么限制等等。 1.      为什么需要使用视图Kylin创建Cube的过程中使用Hive的表数据作为输入源。但是有些情况下,Hive中的表定义和数据并不能满足分析的需求,例如有些列的值需要进行处理,有些列的类型不满足需求,甚至...
阅读(4578) 评论(0)

Apache Kylin高级部分之JDBC访问方式

Kylin提供了标准的ODBC和JDBC接口,能够和传统BI工具进行很好的集成。分析师们可以用他们最熟悉的工具来享受Kylin带来的快速。本章节介绍通过Java程序调用Kylin的JDBC接口访问Kylin的Cube数据。首先我们来看一下连接Kylin的URL格式为:jdbc:kylin://:/注:如果“ssl”为true话,那么上面的端口号应该为Kylin服务的HTTPS端口号。kylin_p...
阅读(3103) 评论(0)

解决镜像无法删除的问题

1. 首先查看镜像...
阅读(2281) 评论(0)

使用阿里云专属加速器加快获取Docker官方镜像的实战

本文档介绍如何使用阿里云专属加速器加快获取Docker官方镜像。步骤如下:1.      首先需要有阿里云账号,没有就注册阿里云开发账号:https://dev.aliyun.com/ 2.      进入加速器页面:https://cr.console.aliyun.com/#/accelerator 我的已经申请好加速器了。 3.      配置(这里只介绍CentOS,其他操作系统上面图中都...
阅读(2470) 评论(0)

《基于Apache Kylin构建大数据分析平台》

经过出版社几个月的辛苦努力,《基于Apache Kylin构建大数据分析平台》终于与读者见面了。现在京东,当当,淘宝,亚马逊等各大网站以及书店已经开始发售,非常感谢很多对Apache Kylin感兴趣的朋友们的支持和鼓励,希望此书可以帮助读者朋友们更好更快的进入Apache Kylin的世界,也希望读者朋友们多提宝贵意见,这样我会更好地完善此书。...
阅读(2356) 评论(8)
292条 共20页1 2 3 4 5 ... 下一页 尾页
    个人资料
    • 访问:421205次
    • 积分:6748
    • 等级:
    • 排名:第3348名
    • 原创:247篇
    • 转载:42篇
    • 译文:2篇
    • 评论:95条
    我的新书
    博客专栏
    文章分类
    最新评论