自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 资源 (1)
  • 收藏
  • 关注

原创 在grep中使用tab符号

今天需要搜索一个字符串%BD%A3%CF%C9,并且字符串的左侧和右侧都是tab符号,后来查询到用-P选项就行了。hdfs dfs -text /user/webrank/luliujie/alpha/20150104/part-r-* | grep -P '\t'%BD%A3%CF%C9'\t' | more而且grep还支持正则表达式。可以直接用^和$符号。

2015-01-07 19:47:37 2407

原创 使用distcp在hadoop集群之间拷贝文件w

今天需要用版本为 0.20.2-cdh3u4的Zeus集群上拷贝文件到版本为2.3.0-cdh5.0.0的晨曦集群上。怎么鼓捣不行。后来用了下面的命令行了。hadoop distcp hftp://rsync.console01.zeus.hadoop.ctc.sogou-op.org:50070/user/webrank/whitelist/ /user/webrank/luliujie/w

2015-01-07 19:44:06 1469

中文分词-北大常宝宝

北大计算语言学 常宝宝老师的课件,关于中文分词的。

2015-10-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除