自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 资源 (4)
  • 收藏
  • 关注

转载 java常用的框架介绍

java常用的框架介绍一、SpringMVChttp://blog.csdn.net/evankaka/article/details/45501811Spring Web MVC是一种基于Java的实现了Web MVC设计模式的请求驱动类型的轻量级Web框架,即使用了MVC架构模式的思想,将web层进行职责解耦,基于请求驱动指的就是使用请求-响应模型,框架

2017-12-29 14:53:28 237

原创 kerberos安装

1.安装配置kerberos      1.1 安装服务端:kdc        yum install -y krb5-server krb5-libs krb5-workstation           1.2 配置服务端:         配置/etc/krb5.conf         includedir /etc/krb5.conf.d

2017-12-26 11:39:00 565

转载 slider简介

背景      YARN是HADOOP2中的通用资源管理平台,但是基于YARN开发应用,需要用户自己编写AM来处理资源申请、容错等,难度和复杂性比较大,因此YARN上运行良好的计算框架只有MapReduce、Spark、Tez等少数几个,而不像其宣传的那样能让各种计算框架运行的非常顺畅       Hortonworks公司最初开发了Hoya,该工具可以在YARN上部署

2017-12-22 14:05:07 1001

转载 大数据平台下多租户架构研究

多租户技术(multi-tenancy technology)是一种软件架构技术,它是在探讨与实现如何于多用户的环境下共用相同的系统或程序组件,并且仍可确保各用户间数据的隔离性。在大数据环境下实现多租户涉及如下关键技术:1. 资源池Hadoop资源池(pool),或者作业池。 每个pool里有一定量的资源(管理员配置),每个用户属于某个pool,其提交的作业可使用这个pool中的资

2017-12-22 10:46:32 2830

转载 Apache Ignite

Apache Ignite(一):简介以及和Coherence、Gemfire、Redis摘要: Apache Ignite 内存数据组织框架是一个高性能、集成化和分布式的内存计算和事务平台,用于大规模的数据集处理,比传统的基于磁盘或闪存的技术具有更高的性能,同时他还为应用和不同的数据源之间提供高性能、分布式内存中数据组织管理的功能。本文将对Igni

2017-12-21 16:01:20 1089

原创 大数据技术概览

Pivotal兑现了其年初对于开源其大数据核心产品GemFire,HAWQ,Greemplum DB的承诺 。这个消息也让Pivotal在国内技术社区风风光光的火了一把,程序猿们可以看到真正的企业级数据仓库是如何设计和实现的。与此同时,开源社区中也存在很多类似的优秀大数据相关项目,涵盖了分布式数据存储与计算,数据处理,数据仓库,机器学习等与数据有关的方方面面,下面就让我们看

2017-12-21 15:51:20 288

转载 数据分析

数据的操作语言是SQL,因此很多工具的开发目标自然就是能够在Hadoop上使用SQL。这些工具有些只是在MapReduce之上做了简单的包装,有些则是在HDFS之上实现了完整的数据仓库,而有些则介于这两者之间。这样的工具有很多,来自于Shoutlet的软件开发工程师Matthew Rathbone最近发表了一篇文章,他列举了一些常用的工具并对各个工具的应用场景和未来进行了分析。Apac

2017-12-21 14:05:02 335

转载 SQL数据分析概览——Hive、Impala、Spark SQL、Drill、HAWQ 以及Presto+druid

转自infoQ! 根据 O’Reilly 2016年数据科学薪资调查显示,SQL 是数据科学领域使用最广泛的语言。大部分项目都需要一些SQL 操作,甚至有一些只需要SQL。本文涵盖了6个开源领导者:Hive、Impala、Spark SQL、Drill、HAWQ 以及Presto,还加上Calcite、Kylin、Phoenix、Tajo 和Trafodion。以及2个商业化选择Ora

2017-12-21 13:59:20 3739

转载 搭建数据仓库第02篇:数据仓库技术架构解决方案

上一篇开了个头,从Kimball数据仓库生命周期方法角度,列出了数据仓库搭建的核心步骤,从这一篇开始将讲述技术路径:技术架构设计和产品选择和安装。首先先以某公司的数据仓库的总体架构图的视角,了解整个数据仓库搭建起来后结构大体的样子。   最底层是数据源,一般是在线的数据库或者是文件系统。对于在线数据库,一般是操作型数据库,比如mysql,oracle等,一般是存在主库和从库

2017-12-19 18:24:43 894

转载 浅析多维体系结构(总线架构), 一致性维度和一致性事实(转载)

转载于http://wenku.baidu.com/link?url=hXWQyKcbE9Y8cUqjTK4r_iCTn18UU63YRdzlCTmf2ZloY5RVFhZYRhN-7bUrgGGjwe7FkjymUUJXhQ08nbq8VgYX-bve8_Bgfjy9TpsPIhK       在Kimball的维度建模的数据仓库中,关于多维体系结构(MD)有三个关键性概念:

2017-12-19 18:23:00 2017 1

原创 搭建数据仓库第01篇:数据仓库开发的生命周期

虽然一直在做数据仓库开发,但是还没有从0开始搭建过数据仓库,所以就想通过学习和思考来搭建一个还不错的数据仓库。比较经典的当属Kimball生命周期方法,它为我们在数据仓库开发过程中提供了路标的作用,生命周期方法的总体结构的核心内容有定义业务需求技术路径技术架构设计产品的选择和安装数据路径维度建模物理设计ETL设计和开发BI应用路径BI应用设计BI应用开发

2017-12-19 18:22:12 1091

原创 五种大数据处理架构

大数据是收集、整理、处理大容量数据集,并从中获得见解所需的非传统战略和技术的总称。虽然处理数据所需的计算能力或存储容量早已超过一台计算机的上限,但这种计算类型的普遍性、规模,以及价值在最近几年才经历了大规模扩展。本文将介绍大数据系统一个最基本的组件:处理框架。处理框架负责对系统中的数据进行计算,例如处理从非易失存储中读取的数据,或处理刚刚摄入到系统中的数据。数据的计算则是指从大量单一数据点

2017-12-14 14:12:21 54489 1

转载 如何在CDH集群启用Kerberos

1.文档编写目的本文档讲述如何在CDH集群启用及配置Kerberos,您将学习到以下知识:1.如何安装及配置KDC服务2.如何通过CDH启用Kerberos3.如何登录Kerberos并访问Hadoop相关服务文档主要分为以下几步:1.安装及配置KDC服务2.CDH集群启用Kerberos3.Ker

2017-12-12 09:51:13 1441

原创 Kerberos简介 —config for users

User config filesThe following files in your home directory can be used to control the behavior of Kerberos as it applies to your account (unless they have been disabled by your host’s configurati

2017-12-11 17:21:33 357

原创 Kerberos简介 —management for users

Password managementChanging your passwordTo change your Kerberos password, use the kpasswd commandGranting access to your accountIf you need to give someone access to log into your a

2017-12-11 16:48:29 210

转载 Sentry手动安装、使用手册

1 Sentry简介Apache Sentry 是Cloudera公司发布的一个Hadoop开源组件,截止目前还是Apache的孵化项目,它提供了细粒度级、基于角色的授权以及多租户的管理模式。Sentry当前可以和Hive/Hcatalog、Apache Solr 和Cloudera Impala集成,未来会扩展到其他的Hadoop组件,例如HDFS和HBase.2 准备2

2017-12-11 15:29:02 8318

原创 Sentry简介— Sentry Client Connection Pool Configuration

Sentry简介— Sentry Client Connection Pool ConfigurationSentry Client Connection Pool is an improvement which make Sentry supports connection pooling in sentry client.Enable Connection Pool in Cl

2017-12-11 15:00:41 791

原创 Sentry简介—Audit Log

Sentry简介—Audit LogThe Sentry audit log is responsible for logging the authorization metadata change, the following operations will be logged:create role, drop role, add role to group, delete r

2017-12-11 14:58:32 510

原创 Sentry简介—Getting Started with Sentry in Hive

Sentry简介—Getting Started with Sentry in HiveSentry uses a policy provider to define the access control to Hive. Sentry currently ships with a file-based policy provider, see below for an example.

2017-12-11 14:42:55 205

原创 sentry简介--architecture and Components

Architecture OverviewSentry ComponentsThere are components involved in the authorization process:Sentry Server: The Sentry RPC server manages the authorization metadata. It supports in

2017-12-11 13:50:38 219

原创 Hive权限管理:

Hive权限管理:因为权限中涉及的用户和组都是Linux的,不可控。建议使用角色,用户可以放置在角色中同时可以为角色进行授权。HIVE支持以下权限:权限名称含义ALL所有权限ALTER允许修改元数据(modify metadata data of object)-

2017-12-11 10:12:08 402

原创 Hbase多租户实现方案—资源限制—quotas

Hbase多租户实现方案—资源限制—quotas    上次整理了hbasde多租户基于namespace的权限管理实现方案,对于一些应用场景,基于namespace权限的多租户还不能够很好的满足业务的需求。业务有时候不单单需要基于权限的多租户,有时候还需要更复杂的基于资源限制调度的多租户,以满足在资源有限的情况下优先保证核心重要业务的正常运行。社区针对这个问题提出了相应的应对措施

2017-12-11 09:47:53 2948

原创 Kerberos

KerberosKerberos 服务(kerberos官网)是一种通过网络提供安全验证处理的客户机/服务器体系结构。通过验证,可保证网络事务的发送者和接收者的身份真实。Kerberos 术语:Principal: kerberos中认证的实体。Principal是用来表示客户端和服务端身份的实体。Principal是由三个部分组成:名字(name),实例(in

2017-12-04 14:23:43 954

原创 HBase的权限管理(namespace)

HBase的权限管理(namespace)HBase的权限管理依赖协协处理器。所以我们需要配置hbase.security.authorization=true,以及hbase.coprocessor.master.classes和hbase.coprocessor.master.classes使其包含org.apache.hadoop.hbase.security. ac

2017-12-04 14:21:40 4938

janusgraph部署开发.docx

JanusGraph over HBase支持全局顶点和边缘迭代。但是,请注意,所有这些顶点和/或边都将加载到内存中,这可能会导致OutOfMemoryException。使用JanusGraph和TinkerPop的Hadoop-Gremlin有效地遍历大型图中的所有顶点或边。

2020-05-15

graylog日志检索系统调研.docx

graylog 调研 --安装 源代码分析 1. Graylog 作为一个开源项目,类没有一行注释,真的是很难想象,

2020-04-26

【恩墨学院】CDH集群的企业部署.pdf

cdh安装及部署文档:操作系统修改,cm安装,cdh安装.///

2019-10-16

Oozie的安装与配置.docx

oozie安装文件:Oozie的安装与配置及自带example演示。1111

2019-10-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除