治辉料码
码龄11年
关注
提问 私信
  • 博客:96,449
    96,449
    总访问量
  • 23
    原创
  • 2,328,528
    排名
  • 13
    粉丝
  • 0
    铁粉

个人简介:程序员一枚,翻译过camel软件图书,参与过阿里巴巴数据库连接池Duid开发,主持过全国税务核心业务平台搭建。现在大数据公司码农。 来吧一块学习大数据。 喜欢看书,喜欢思考。 保持正念,主人翁我在,拒绝自动驾驶。

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:陕西省
  • 加入CSDN时间: 2014-06-03
博客简介:

大数据学习成长之路

博客描述:
从hadoop基础学习到hive、sqoop、oozie、Hbase、spark等的框架实战应用。
查看详细资料
个人成就
  • 获得10次点赞
  • 内容获得5次评论
  • 获得84次收藏
创作历程
  • 23篇
    2018年
成就勋章
TA的专栏
  • Hive
    7篇
  • Hadoop
    5篇
  • Hdfs
    4篇
  • oozie
    9篇
  • hue
    1篇
  • Hbase
    3篇
  • Linux
    2篇
兴趣领域 设置
  • 大数据
    hadoophivestormsparketl
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

OSB安装部署.doc

发布资源 2019.07.09 ·
doc

linux|rpm命令安装软件包

1、cd配置centos的ISO文件2、挂载cdrom [root@localhost Packages]# mount /dev/cdrom /media3、利用wc统计一下rpm按照包的个数查看某文件是否安装 [root@localhost Packages]# rpm -qa | grep yp-tools 参数说明: -q 表...
原创
发布博客 2018.05.28 ·
11378 阅读 ·
1 点赞 ·
0 评论 ·
9 收藏

powerdesigner 16.5破解文件

发布资源 2018.05.21 ·
rar

linux各发行版本下载地址

别乱找了6.4下载地址及其他下载地址 http://vault.centos.org/6.4/isos/x86_64/ 目前商用最多的linux发行系统是centos系统。 centos被红帽收购了。
原创
发布博客 2018.05.17 ·
1244 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Hbae批量装载(Bulk Loading)

什么是bulk load HBase 有好几种方法将数据装载到表。最直接的方式即可以通过MapReduce任务,也可以通过普通客户端API。但是这都不是高效方法。 批量装载特性采用 MapReduce 任务,将表数据输出为HBase的内部数据格式,然后可以将产生的存储文件直接装载到运行的集群中。批量装载比简单使用 HBase API 消耗更少的CPU和网络资源。使用BU...
原创
发布博客 2018.05.10 ·
2742 阅读 ·
0 点赞 ·
0 评论 ·
5 收藏

使用importTsv完成HBase 的数据迁移

数据迁移场景举例Hbase集群装好了,若需要往表中装数据;数据的备份,如测试集群往生产集群上迁移。几种HBase数据导入方式(不推荐使用)使用Hbase Put API:例如MapReduce也是使用Put API 使用Hbase批量加载工具 自定义的MapReduce job 这三种方式都涉及到Put内置,大多数数据迁移场景都涉及到数据的导入(import),从存在的...
原创
发布博客 2018.05.10 ·
1527 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

编写MapReduce程序,集成HBase对表进行读取和写入数据

参考地址:http://hbase.apache.org/boot.html#mapreduce导入:import org.apache.hadoop.conf.Configured; 导入:import org.apache.hadoop.util.Tool;。 三要素创建Mapper Class 创建Reducer Class 创建Driver创建Mapper...
原创
发布博客 2018.05.07 ·
1808 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

Cloudera Hue

Hue是Cloudera开源的一个Hadoop UI,由Cloudera Desktop演化而来。面向用户提供方便的UI用于平时的Hadoop操作中。Apache Ambari面向的是管理员,用于安装、维护集群,而不是使用集群。两者针对的是不同需求。依赖安装:“` sudo yum install krb5-devel cyrus-sasl-gssapi cyrus-sasl...
原创
发布博客 2018.04.17 ·
1045 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Oozie 介绍

Hadoop 调度框架Linux Crontab Azkaban https://azkaban.github.io/Oozie http://oozie.apache.org/Zeus https://github.com/michael8335/zeus2Azkaban, Open-source Workflow ManagerOozie, Workfl...
原创
发布博客 2018.04.05 ·
4080 阅读 ·
1 点赞 ·
0 评论 ·
3 收藏

oozie 异常

异常1Stack trace for the error was (for debug purposes):--------------------------------------org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.authorize.AuthorizationException): Us...
原创
发布博客 2018.04.05 ·
327 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

oozie安装部署

安装步骤 解压–>配置代理用户–>解压oozie依赖的hadoop包–>复制hadoop依赖包到libext目录–>把ext*.zip包放到libext中–>准备oozie的war包–>oozie依赖包上传到HDFS系统–>创建oozie数据库–>修改oozie依赖hadoop配置文件路径–>启动oozie环境要求配置...
原创
发布博客 2018.04.05 ·
266 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Oozie案例运行MapReduced Workflow

解压oozie-examples.tar.gz[beifeng@hadoop-senior oozie-4.0.0-cdh5.3.6]$ tar -zxvf oozie-examples.tar.gz 上传Examples The examples/ directory must be copied to the user HOME directory in HDFS...
原创
发布博客 2018.04.05 ·
454 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Oozie 报错的解决方法

错误信息org.apache.oozie.action.ActionExecutorException: Could not locate Oozie sharelib at org.apache.oozie.action.hadoop.JavaActionExecutor.addSystemShareLibForAction(JavaActionExecutor.java:614...
原创
发布博客 2018.04.05 ·
1178 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

oozie工作流定义

介绍流程定义流程节点启动节点结束节点Kill Control NodeMap-Reduce ActionA map-reduce action can be configured to perform file system cleanup and directory creation before starting t...
原创
发布博客 2018.04.05 ·
708 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Oozie WorkFlow中Hive Action案例

官方地址http://archive.cloudera.com/cdh5/cdh/5/oozie-4.0.0-cdh5.3.6/DG_HiveActionExtension.html复制样例重新命名后对hive进行修改 cp -r examples/apps/hive oozie-apps/mv oozie-apps/hive hive-select修改hiv...
原创
发布博客 2018.04.05 ·
1334 阅读 ·
0 点赞 ·
2 评论 ·
0 收藏

WorkFlow中Sqoop Action运行案例

复制样例[beifeng@hadoop-senior oozie-4.0.0-cdh5.3.6]$ cp -r examples/apps/sqoop oozie-apps/样例重新命令mv sqoop sqoop-import复制mysql依赖包[beifeng@hadoop-senior oozie-apps]$ mkdir sqoop-import/l...
原创
发布博客 2018.04.05 ·
332 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

WorkFlow中Sqoop Action使用案例错误总结

job.properties 中可能出现的错误jobTracker=hadoop-senior.beifeng.com:8032 端口错误 jobTracker的端口设置错误 8032 。表示是yarn的运行地址及端口号oozieAppsRoot 地址错误 表示 在HDFS上oozie运行sqoop流程job的目录。目录前后把反斜杠都去掉。正确写法是oozieA...
原创
发布博客 2018.04.05 ·
337 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

netcatnetcatnetcat

发布资源 2018.03.22 ·
rpm

Hive的UDF编程

官方地址:https://cwiki.apache.org/confluence/display/Hive/HivePlugins什么是UDF(user-Define-Function)?用户定义的函数。查看hive自带的函数。show funtion;查询某个函数的详细使用手册desc function extended split ; UDF几种类型UDF(User-Defined-Func...
原创
发布博客 2018.03.08 ·
247 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

Hive中order by、sort by、distribute by和cluster by

Order By语法colOrder: ( ASC | DESC )colNullOrder: (NULLS FIRST | NULLS LAST) -- (Note: Available in Hive 2.1.0 and later)orderBy: ORDER BY colName colOrder? colNullOrder? (',' colName colOrd...
原创
发布博客 2018.03.08 ·
443 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏
加载更多