自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (20)
  • 收藏
  • 关注

原创 spark on yarn日志切割

由于spark on yarn的日志会在stderr里面一直追加,而且streaming又是长应用,那么stderr会一直增长。解决办法就是把stderr按天切割,这样我们就可以删除之前的日志了。1. 首先,把集群中的hadoop的log4j文件/etc/hadoop/conf/log4j.properties添加如下两行:log4j.additivity.com.kingsoft = f

2015-03-26 12:01:17 1991

原创 hiveSQL记录

CREATE EXTERNAL TABLE ks3_nginx_pv(host_ip string,idc string,upstream_ip string,bucket_owner string,`bucket` string,time bigint,time_id int,remote_ip st

2015-03-25 19:55:28 1444

原创 start Java程序的脚本

#/bin/sh####################. /etc/profileSCRIPT_NAME=$0home=/data/apps/real_calculation_kssNodeNginx#define some variouslibdir=${home}/liblogdir=${home}/logname=KSSNodeRealTim

2015-03-24 15:13:18 789

转载 spark内核简介

1、Spark介绍Spark是起源于美国加州大学伯克利分校AMPLab的大数据计算平台,在2010年开源,目前是Apache软件基金会的顶级项目。随着Spark在大数据计算领域的暂露头角,越来越多的企业开始关注和使用。2014年11月,Spark在Daytona Gray Sort 100TB Benchmark竞赛中打破了由Hadoop MapReduce保持的排序记录。Spark利用1

2015-03-18 15:27:34 730

原创 CDH5.1.0编译spark-assembly包来支持hive

原生的spark assembly jar是不依赖hive的,如果要使用spark hql必须将hive相关的依赖包打到spark assembly jar中来。打包方法:假设已经装好了maven,1添加环境变量,如果jvm的这些配置太小的话,可能导致在编译过程中出现OOM,因此放大一些:export MAVEN_OPTS="-Xmx2g -XX:MaxPermSize=5

2015-03-16 15:47:07 3305 1

原创 Linux文件做软链

用flume做数据采集的时候会遇到一种情况,就是业务端打印日志的时候,日志的目录不统一,那么我们在配置flume的配置文件时,就要根据不同的机器做不同的配置,很麻烦。我们用软链可以解决这个问题。hour=`date +%Y-%m-%d.%H`file=kvdbnode_$hour.log.TRACEsudo ln -sf /data/apps/kvdb/log/kvdb/$file  

2015-03-16 14:44:04 823

转载 hadoop put内部调用,hdfs写文件流程

HDFS是一个分布式文件系统,在HDFS上写文件的过程与我们平时使用的单机文件系统非常不同,从宏观上来看,在HDFS文件系统上创建并写一个文件,流程如下图(来自《Hadoop:The Definitive Guide》一书)所示:具体过程描述如下:Client调用DistributedFileSystem对象的create方法,创建一个文件输出流(FSDataOutputStr

2015-03-10 15:58:50 4830

原创 sort awk comm命令

今天遇到一个问题,有两个文件,都是hive输出的,字段以table分开,需要两个文件里面的第10个字段,然后找出在第一个文件里的而不再第二个里面的内容。这个问题需要分几个步骤去做:1. 分别取出两个文件的第10个字段重定向到不同的文件中。cat aa.txt |awk '{print $10}' >aa1.txtcat bb.txt |awk '{print $10}'

2015-03-03 14:45:24 723

mmseg4j完美适配solr5.2.1

之前在网上下载的mmseg4j都不能适配最新的solr5.2.1,后来找到了最新版的jar包完美解决

2015-08-15

mapreduce生成RCFile的jar包

mapreduce生成RCFile的jar包

2015-02-12

metaQ向spark传数据

metaQ向spark传数据

2014-09-25

metaQ的安装包

metaQ的安装包

2014-09-25

flume安装包

flume的安装包,包括agent和server

2014-09-25

hadoop安装笔记

hadoop安装笔记

2014-07-23

Myeclipse好用的几款插件

ExploreFS,net.sf.fjep.fatjar_0.0.31,org.adarsh.jutils_3.1.0,propedit_5.3.4

2013-11-29

图表插件,基于flash

图表工具,无语言相关,方便使用,有饼状图,柱状图,线图等,效果很炫

2013-01-07

jquery tree

jquery的树形结构,级联下拉菜单,带复选框勾选

2013-01-07

Memcached原理详解

Memcached原理详解

2012-08-16

php服务器安装程序

超级简单的php服务器安装程序,包括mysql的安装和数据库管理页面程序

2012-08-15

图片流,页面置顶

图片墙异步加载,页面置顶并且动态滑动图片墙异步加载,页面置顶并且动态滑动

2012-08-15

artDialog页面弹出框

artDialog的特殊UI框架能够适应内容变化,甚至连外部程序动态插入的内容它仍然能自适应,因此你不必去考虑消息内容尺寸使用它。它的消息容器甚至能够根据宽度让文本居中或居左对齐——这一切全是XHTML+CSS原生实现。

2012-08-15

瀑布图片墙

瀑布图片墙,类似嘀咕的效果,可以实现异步加载

2012-08-13

myeclipse中svn插件

在myeclipse中添加svn插件,就可以右键importSVN中的程序

2012-08-09

Google Maps Javascript API V3开发包

Google Maps Javascript API V3 Reference 适用于页面调用谷歌地图,弹出窗口等功能

2012-08-03

瀑布图片墙.zip

照片墙的加载,瀑布式加载图片.就像嘀咕网一样的效果

2012-08-01

Jquery点击小图片动态显示大图

点击小图片可以动态显示大图片,当点击大图片时它会自动消失

2012-07-18

C语言+Socket实现文件传输

实现文件传输功能~使用与初学者对socket的了解和深一步的研究!希望能给大家带来帮助

2010-10-05

计算器效果很不错JAVA源程序

很不错的!界面效果也很好~算法精确到小数点后10位!欢迎大家下载

2010-06-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除