自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 资源 (5)
  • 收藏
  • 关注

原创 通过文件大小和MD5校验识别重复文件

#!/bin/sh if [ $# != "1" ] || [ $1 = "--help" ];then echo "Sytax:md5-sum.sh directory"; exit; fi echo "Begin" #file-list list=$(find $1); #rm $(rm -fr file_tmp.txt) $(rm -fr file_result.

2016-01-05 18:14:48 3327

通过文件大小和MD5校验批量识别重复文件

通过文件大小和MD5校验批量识别重复文件

2016-01-05

crontab shell调用spark-sql,实现周期性动态SQL批量自动执行.rar

对于熟悉Scala开发的人来说,对于spark-sql的使用,直接jar包中写入代码处理就能轻松实现动态语句的执行。 但是对于我,不打算学习Scala和Java语言,但是又想定时执行时间推延的周期、定时任务,该肿么办? spark-sql CLI几个参数,完全满足我等非专业人员。

2015-12-18

Hadoop CDH5.5.0 配置(Hdfs/Yarn HA)

之前一直在网上找社区版hadoop的配置,发现CDH安装直接界面搞定,自动生成配置。供检查学习。

2015-12-18

linux-结构化成行成列-小文件循环合并成大文件--方便上传hadoop

linux-结构化成行成列-小文件循环合并成大文件--方便上传hadoop: 文件到达门限后上传,或者文件时间戳超过门限时间,上传HDFS,防止小文件过多上传。

2015-12-14

标题 状态 阅读 评论 评论权限 操作 CDH5.5上安装Rhadoop,RStudio server版初始化SparkR

RStudio 安装完成后,如何初始化sparkR?CDH5不能用sparkR? CDH5只要hdfs和hive,spark直接公网下载最新版本,然后直接spark on yarn. sparkR初始化即可调测。

2015-12-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除