自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 资源 (1)
  • 收藏
  • 关注

原创 linux下git的安装和使用

最近在使用github,感觉不错。在windows下,可使用github提供的windows客户端(http://windows.github.com/)。很傻瓜,很方便。如何使用?详见:http://www.cr173.com/html/15618_1.html。(有图是王道)最近发现,在公司电脑上安装github的windows客户端时,可能由于公司网络限速和限流量限得太死,怎么也安装不成功。

2015-02-11 21:06:52 501

转载 Hadoop-2.3.0-cdh5.0.0获取源码及编译

1、安装Maven 首先下载Maven软件包, 下载地址为: http://apache.fayea.com/apache-m ... en-3.1.1-bin.tar.gz 百度网盘: apache-maven-3.2.1.zip 链接:http://pan.baidu.com/s/1jG9QhWa 密码:vmee 下载后解压,设置MAVEN_HOME和PATH变量。设置好后,

2015-01-25 21:05:55 576

转载 Cluster-hadoop集群搭建

1.YARN的基础架构是什么? 2.哪一进程防止Yarn早就web攻击? 3.Zookeeper主进程是哪个? 4.如何下载cdh包? 本文搭建Hadoop CDH5.0.1 分布式系统,包括NameNode ,ResourceManger HA,忽略了Web Application Proxy 和Job HistoryServer。 一概述(一)HDFS

2015-01-25 20:57:35 1000

原创 win7 下安装mysql 整理

1.去官网下载mysql-5.6.13-winx64.zip包。地址: http://dev.mysql.com/downloads/mysql/5.6.html 2,把安装包解压到自己指定的目录,我的解压目录为C:\Users\vstouch\Documents\mysql-5.6.13-winx64,解压后如下: 其中my-default.ini 是默认配置文件我们可以自己新建一个m

2015-01-20 20:58:25 393

转载 hadoop datanode 重新启动和hbase regionserver重新启动

我自己有了个集群,现在datanode 宕机了. datanode通过 ssh ccc "/home/hadoop/bin/hadoop-daemon.sh start datanode" ssh ccc "/home/hadoop/bin/hadoop-daemon.sh start tasktracker" 重起后, 那么在datanode上的hbase如何重起? 我自己有了个集群,现在d

2015-01-20 16:05:40 952

转载 hbase 学习梳理

一、HBASE 简介 HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文"Bigtable:一个结构化数据的分布式存储系统"。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop

2015-01-15 23:00:15 359

转载 安装cloudera-manager

安装cloudera-manager ssh免密码登陆 在crxy210上 ssh-keygen -t rsa; cat ~/.ssh/id_rsa.pub >>~/.ssh/authorized_keys;   免密码相互登陆本 在crxy210-215上面分别 rm –f ~/.ssh/*   ssh-keygen -t rsa  

2015-01-15 22:52:42 651

转载 eclipse与Hadoop集群连接

eclipse与Hadoop集群连接 2014年11月24日 ⁄ hadoop ⁄ 暂无评论 Eclipse的Hadoop插件 参考:http://blog.csdn.net/cybercode/article/details/7084603 http://www.cnblogs.com/xia520pi/archive/2012/05/20/2510723.html

2015-01-15 22:47:07 628 1

原创 sqoop安装与使用

Sqoop的安装与使用 2013年08月12日 ⁄ hadoop及周边, sqoop ⁄ 评论数 4 Sqoop是一个转换工具,用于在关系型数据库与HDFS之间进行数据转换。强大功能见下图 以下操作就是使用sqoop在mysql和hdfs之间转换数据。 1.安装 我们使用的版本是sqoop-1.4.3.bin__hadoop-1.0.0.tar.gz,打算安装在/usr

2015-01-15 22:16:48 419

原创 使用sqoop做Mysql与Hive数据互倒操作

sqoop是干吗的,就不在这里浪费笔墨了,这里主要讲下一个新手接触到sqoop碰到的问题。 一  业务场景 Hive 查询Hql的结果进入MySql,目前本人是通过两步来实现的, 1 把hive查询结果直接进入Hive的表a(a表需要创建,结构需要和b一样) 2 通过sqoop把表a的内容导入到MySql表b(b表已经存在), 这个时候你需要现在hive上创建a表,假如b表字段很多,你需要

2015-01-15 22:12:42 425

转载 Redis教程

一 Redis介绍          Redis是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。从2010年3月15日起,Redis的开发工作由VMware主持。     Redis能运行在大多数POSIX(Linux, *BSD, OS X 和Solaris等)系统上,官方没有支持Windows的版本。

2015-01-12 23:24:58 327

转载 什么是Oozie?

首先本人以前还真不知道Oozie这个东东,经别人说才知道,所以感觉也是比较惭愧。毕竟正在做的项目DIP-DATA-ANALYZE与这个有些共同处,就是提供类似工作流的机制更好的调度任务。不过Oozie支持的更多,支持了pig,直接mr,streaming。我们目前是基于hive的,当然也可以支持streaming,mr,不过目前还没有。         另外一个不同是Oozie使用自定义的xml

2015-01-12 23:07:23 737

转载 NoSQL】NoSQL入门级资料整理(CAP原理、最终一致性)

传统关系型数据库面临的挑战 l High Performance——对数据库高并发读写的需求 l Huge Storage——对海量数据的高效率存储的需求 l High Scalability & High Availablity——对数据库的高可扩展性和高可用性的需求。   对于当前的很多网站来说,关系数据库的很多主要特性往往无用武之地,例如: l 数据库事务一致性需求 很多系统并

2015-01-12 22:46:26 566

转载 Clouder CDH Hadoop安装

1、先保证你的yum源是最新可用的,这样可以省好多事,例如pax, patch, python-setuptools都会被CDH3组件依赖。 2、安装jdk, jre。 但对非RPM版本的不认,在安装CDH3的时候会提示缺少sun-java6。安装rpm包后可继续,但我想会有解决办法,如果哪位有答案请留言,万分感谢! 3、添加cloudera的yum源,当然你是专业的系统工程师且很有闲

2015-01-12 22:44:21 412

转载 CentOS-5.9系统下Ganglia-3.6.0监控集群安装配置实践

CentOS-5.9系统下Ganglia-3.6.0监控集群安装配置实践 Ganglia是UC Berkeley发起的一个开源集群监视项目,设计用于测量数以千计的节点。Ganglia的核心包含gmond、gmetad以及一个Web前端。Ganglia集群主要用来监控系统性能,它由RRDTool工具处理数据,并生成相应的监控相关的图形,并提供一个Web控制台来直观地提供给客户端,管理员可以通过丰富

2015-01-12 22:34:22 479

转载 map join的与Reduce Join效率对比

MAPJION会把小表全部读入内存中,在map阶段直接拿另外一个表的数据和内存中表数据做匹配,由于在map是进行了join操作,省去了reduce运行的效率也会高很多 使用一个表测试,该表时5分钟表,数据很少,大概60多w。 测试日志里包含多个字段,其中有uid和uip。测试场景为给出2个uid,取uid共同的uip。 三个不同uid select /*+

2015-01-12 22:30:51 1093

JMeter基本使用方法.pdf

JMeter基本使用方法.pd,主要是讲解jmeter 的基本使用方法和参数比较详细哦

2014-11-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除