ITrue的天空
码龄12年
关注
提问 私信
  • 博客:16,379
    16,379
    总访问量
  • 5
    原创
  • 1,705,337
    排名
  • 4
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:浙江省
  • 加入CSDN时间: 2012-12-11
博客简介:

Arch_zly的博客

查看详细资料
个人成就
  • 获得2次点赞
  • 内容获得1次评论
  • 获得7次收藏
创作历程
  • 5篇
    2018年
  • 1篇
    2017年
成就勋章
TA的专栏
  • HIVE
    2篇
  • Hadoop
    2篇
  • Spark
    1篇
  • Python
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

HIVE Streaming小结

HIVE中的查询可以结合使用非java语言的脚本(比如shell、python、perl等),达到另一种处理数据的方式。下面通过自己亲自实践的测试程序说明Streaming的常见用法:(1)恒等变换(2)改变类型(3)投影变换(4)操作转换(5)使用分布式内存(6)CLUSTER BY、DISTRIBUTE BY、SORT BY(7)计算cogroupStreaming HIVE是通过...
原创
发布博客 2018.04.29 ·
4340 阅读 ·
2 点赞 ·
1 评论 ·
3 收藏

一个简单的UDF小程序(HIVE)

一个运行于HIVE的简单的UDF程序,可以作为对UDF的一个简单的入门,你自己也可以很容易的亲自实践。主要包括以下步骤: 在hive中建一个测试用例表、编辑UDF的java程序、HIVE中添加JAR包并创建UDF临时函数(1)在hive中建一个测试用例表(当然如果你已经有合适的数据可以跳过这一步)create table littlebigdata(name string,email str...
原创
发布博客 2018.04.27 ·
2353 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

spark 基于分区操作 mapPartitions

基于分区对数据进行操作可以让我们避免为每个数据元素进行重复的配置工作。诸如打开数据库连接或者创建随机生成数等操作,都是我们应当避免的为每个元素都配置一遍的工作。Spark提供基于分区的map和foreach,让你的部分代码只对RDD的每个分区运行一次,这样可以帮助降低这些操作的代价。当基于分区操作RDD时,Spark会为函数提供该分区中的元素的迭代器。返回值方面,也返回一个迭代器。Spark 提供...
原创
发布博客 2018.04.10 ·
8172 阅读 ·
0 点赞 ·
0 评论 ·
11 收藏

动手实现第一个Hadoop程序的扩展

上篇文章简单总结了一下,在独立模式下实现测试第一个MapReduce程序,下面算是对上篇文章的一个补充吧。主要 分为  Hadoop横向扩展、combiner函数、Hadoop Streaming 三个部分。1 Hadoop横向扩展    前面介绍了 MapReduce针对少量数据是如何工作的,当我们有大量的输入数据流时,为了实现横向扩展,我们需要把数据存储在分布式分拣系统中(典型的是HDFS),...
翻译
发布博客 2018.03.28 ·
523 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

动手实现第一个Hadoop程序(VMware)

测试Hadoop环境:版本 2.6.0 本篇文章主要侧重于亲自实践一个Mapreduce程序在Hadoop上运行,如果需要详细了解测试用到的MapReduce程序的详细内  容,建议翻阅《HADOOP权威指南》。 第一步:确保HADOOP环境已经搭建成功              HADOOP环境的搭建不是本篇的重点,实际上独立(或本地)模式的环境还是比较好搭建的,可以用如下命令测试:hadoop...
原创
发布博客 2018.03.27 ·
341 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

HIVE时间函数小结

最近使用HIVE时,经常遇到一些对时间字段进行处理的情况。所以总结了一下HIVE中时间函数,可能不是特别全面,仅供大家交流参考。直至上传这篇小结时,还没有找到处理月份加减的函数,类似ORICLE中的ADD_MONTHS函数,如果你有好的方法,也请多多交流哦。个人之前看了很多有关这方面的总结或者文章,都是以纯文字的方式展现,希望这篇小结可以加深你的印象。关于函数的具体用法,则不是这篇小结的重
原创
发布博客 2017.11.26 ·
649 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏