咕噜大大的专栏

我是咕噜大大

Cloudera简介和安装部署概述

最近作者在研究Cloudera,并且在自己的虚拟机集群安装部署成功,所以在此做个分享,帮助大家尽快构建自己的Cloudera环境并运用起来。文章将会对Cloudera以及其安装时涉及到的组件做一个简单的介绍,并把官方文档中介绍的3种安装部署方式做一个概要的说明。

2016-09-06 11:27:10

阅读数 21811

评论数 1

Flume+Spark+Hive+Spark SQL离线分析系统

前段时间把Scala和Spark一起学习了,所以借此机会在这里做个总结,顺便和大家一起分享一下目前最火的分布式计算技术Spark!当然Spark不光是可以做离线计算,还提供了许多功能强大的组件,比如说,Spark Streaming 组件做实时计算,和Kafka等消息系统也有很好的兼容性;Spar...

2016-07-27 03:36:02

阅读数 8913

评论数 3

Flume+Kafka+Storm+Redis实时分析系统基本架构

今天作者要在这里通过一个简单的电商网站订单实时分析系统和大家一起梳理一下大数据环境下的实时分析系统的架构模型。当然这个架构模型只是实时分析技术的一个简单的入门级架构,实际生产环境中的大数据实时分析技术还涉及到很多细节的处理, 比如使用Storm的ACK机制保证数据都能被正确处理, 集群的高可用架构...

2016-07-24 01:24:08

阅读数 45876

评论数 20

Flume+Hadoop+Hive的离线分析系统基本架构

最近在学习大数据的离线分析技术,所以在这里通过做一个简单的网站点击流数据分析离线系统来和大家一起梳理一下离线分析系统的架构模型。当然这个架构模型只能是离线分析技术的一个简单的入门级架构,实际生产环境中的大数据离线分析技术还涉及到很多细节的处理和高可用的架构。这篇文章的目的只是带大家入个门,

2016-05-31 01:01:11

阅读数 18184

评论数 3

HBase数据模型解析和基本的表设计分析

最近在学习HBase的使用,并仔细阅读了一篇官方推荐的博客,在这里就以一边翻译一边总结的方式和大家一起梳理一下HBase的数据模型和基本的表设计思路。 官方推荐的博客原文地址:http://0b4af6cdc2f0c5998459-c0245c5c937c5dedcca3f1764ecc9b2f....

2016-04-25 20:27:40

阅读数 30079

评论数 62

Hadoop Mapreduce本地调试

Mapreduce 是Hadoop上一个进行分布式数据运算和统计的框架,但是每次运行程序的时候都需要将程序打包并上传的集群环境中运行,这就会让程序的调试变得十分不方便。所以在这里写下这篇博客和大家交流学习如何在本地调试Mapreduce程序。        我的本地开发环境是Mac10.11....

2016-04-16 19:39:48

阅读数 7659

评论数 0

SSH免密登录的配置

SSH 主要有两种登录方式,一种是密码的登录方式,另一种就是免密的公钥登录方式。 第一种硬密码的登录方式有很多弊端:        1:手打密码远程连接服务器这种方式很不安全,尤其是有新的运维人员要使用服务器时,告知硬密码是十分容易导致密码泄露的。         2:在做一些集群部署...

2016-04-09 13:59:23

阅读数 1077

评论数 0

快速搭建maven+springMVC3.0+mybatis项目

教你如何快速搭建一个在maven管理下的springMVC+mybatis3.0项目

2015-08-01 15:58:09

阅读数 796

评论数 0

Groovy入门教程

最近我的BOSS要开始一个新的电商项目,并初步定下开发语言为Java,因为扩展性好,安全性高,再加上中国满大街的Java开发人员和铺天盖地的Java开发资料,都让我们觉得在人力资源和开发方面会比较有保障。但是后来我们在确定开发框架的时候就拿不定主意了,有部分人认为应该使用目前普遍流行的SSH框架(...

2015-02-14 14:53:19

阅读数 975

评论数 0

MyBatis映射文件中多参数传递的问题

文章转载自:http://www.cnblogs.com/mingyue1818/p/3714162.html?utm_source=tuicool 一、单个参数: public List getXXBeanList(String xxCode);   select ...

2015-01-28 19:28:32

阅读数 937

评论数 0

Mybatis3和Spring3整合下的编程式事务管理

大家都知道在对数据库操作时,最重要的就是要保证业务的原子性和一致性,这样才能基本保证数据库中数据的正确性。就比如说,某个系统中有两张表,一个是用户表users,另一个是用户的基本信息表users_info,用来保存用户真实姓名,地址,联系电话等,这两张表是1对1的关系,并且当新用户注册进users...

2015-01-27 04:08:50

阅读数 3472

评论数 0

在MAC下的Maven2安装使用教程

正如大家所知的,maven是Apache底下的一个项目构建和管理工具,主要的功能有项目中依赖的jar包管理,项目的构建(build),清理,编译,打包部署,运行测试用例,生成报告和文档,软件配置管理,发布管理等等(要活用“等等”这个词,当你不知道这玩意还有什么功能时,写上“等等”,就会显得很专业的...

2015-01-08 18:40:52

阅读数 2127

评论数 0

提示
确定要删除当前文章?
取消 删除