自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 hive中文字段乱码问题

建表有中文字段,有乱码,因为元数据的columns_v2表默认用的是latin1编码,有中文字段时需要对它进行修改进入mysql中,执行alter table columns_v2 modify column COLUMN_NAME varchar(128) character set utf8;注释乱码一起解决了1、然后进入数据库执行以下5条SQL语句:(1)

2017-01-10 15:06:22 3327

原创 spark的standalone集群搭建

解压spark-1.4.1-bin-hadoop2.6.tgz,解压后的文件mv为spark不配置环境变量了,因为它的启动命令start-all.sh与Hadoop相同在spark/conf目录下,把spark-env.sh.template重命名为spark-env.sh,增加配置项export JAVA_HOME=/usr/local/jdkSPARK_MASTER_IP=ma

2016-10-31 10:07:09 219

原创 storm集群搭建

以来zk,所以要先搭建启动zk集群解压apache-storm-0.9.3.tar.gz,把解压后的文件mv成storm配置/etc/profile环境变量,source一下改storm/conf中的配置文件storm.yaml,注意空格的问题storm.zookeeper.servers:    - "master"    - "slave1"    - "s

2016-10-31 09:56:39 166

原创 换yum源

把虚拟机调成桥接模式,ip设为动态获取换的是阿里的yumwget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-6.repoyum makecachecentos的telnet服务不可用,要自己装详细见连接http://jingyan.baidu.com/arti

2016-07-04 16:08:57 246

原创 hbase分布式集群搭建

它是hadoop的数据库,表的、列的一些重要信息存放在zookeeper上,所以要先搭建hadoop和zookeeper把hbase路径加入环境变量中解压tar包改配置文件hbase-env.shexport JAVA_HOME=/usr/local/jdkhbase-site.xml                        hbase.rootdir

2016-07-01 19:27:00 224

原创 sqoop安装

sqoop是通过mapereduce将hadoop和关系型数据库相互转化的数据转换工具,准备:jdk安装:hadoop集群搭建:mysql安装:下载sqoop  tar包,加压,配置环境变量把/sqoop/conf下的sqoop-env-template.sh重命名为sqoop-env.sh,sqoop-site-template.xml重命名为sqoop-site.xml修改sqoo

2016-06-21 17:16:53 279

原创 kafka搭建

准备:3台虚拟机,配置好zookeeper集群:下载kafka的tar包,解压:配置环境变量进入config中的server.properties改配置文件broker.id=1     //broker的标识,id不能重复log.dirs=/usr/local/kafka/kafka-logs     //日志目录num.partitions=1   //分区数目

2016-06-21 15:09:12 319

原创 zookeeper集群搭建

准备3台虚拟机,hosts文件中的映射要配好下载tar包,可以在外面改好后将解压修改后的文件夹放进/usr/local目录修改配置文件zoo.cfgdataDir=/usr/local/zookeeper/datadataLogDir=/usr/local/zookeeper/logserver.1=master:2888:3888server.2=slave1:2888:

2016-06-18 11:48:44 173

原创 hive搭建

hive是依赖于hadoop的数据仓库的工具,sql语句转换成mapreduce进行计算,存储在hdfs上搭建hive前期准备配置jdk环境,hadoop环境,下载hive包解压,配置hive环境变量,安装mysql修改hive配置文件将hive-default.xml.template文件cp一份为hive-site.xml  修改hive-site.xml 

2016-06-18 08:46:16 826

原创 hadoop集群搭建

环境:linux虚拟机3台centos,jdk1.8,hadoop2.6.0前期准备1.配置虚拟机环境验证:互相ping IP2.配置jdk环境变量验证:java -version3.ssh免密码,机器之间的ssh用命令  ssh-copy-id  主机名验证:ssh localhost4.下载解压缩hadoop,配置hadoop环境变量进入/hadoop/et

2016-06-17 22:42:51 387

原创 storm

遇到的问题maven缺少依赖,下不了jar包在网上找了篇博客修改 Maven 的配置文件(安装目录下的 conf/settings.xml 文件),将 .. 间的内容改为: repository. The repository that | this mirror serves has an ID that matches the

2016-05-05 15:28:43 188

原创 工厂模式

工厂方法模式是创建型模式,定义一个创建产品对象的工厂接口,将实际的创建工作推到子类当中完成,只负责具体工厂子类必须实现的接口,这样就可以让系统在不修改具体工厂角色的情况下引进新的产品        写了一个非常简单的加法计算器,模拟工厂模式的实例        有一个抽象类,抽象方法是计算2数相加之和        public abstract class Operation {

2014-12-21 14:58:19 187

原创 Lucene的学习

今天才开始学Lucene,这也是很久前就想学然后一直滞留没学的东西,压力真的是个好东西,能让人不断前行的动力.        Lucene即全文检索,它是为每一个进检索器的对象构建索引,这就有区分数据库直接用%%检索,我目前的公司有项搜索组织,部门,人员的功能,用的就是sql语句去模糊查询,因为是个内部系统,因此这种方法倒也够用.但是不能应付成千上万的数据,运行效率会极低的,况且执行还是调用的

2014-11-29 09:25:19 388

原创 三大框架整合

随着ctrl+v,ctrl+z用的越来越多,脑子也越来越钝化了,解决问题的能力也日渐下滑,因为近几天的小挫折,让我意识到自己严重的问题,以前虽然不聪明,但是还能剩下勤奋,现在唯一的有点也要随之渐行渐远了,强大的危机意识逐渐复苏,今天就从最开始的三大框架开始整起吧.       1.导包(spring3.0.2+hibernate3+struts2 2.3.3  包就不贴了,要培养下载合适的包的

2014-11-27 21:26:54 462

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除