自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

转载 在Apache Spark中使用UDF

用户自定义函数(UDF)是大多数SQL环境的一个关键特性,其主要用于扩展系统的内置功能。UDF允许开发人员通过抽象其低级语言实现在更高级语言(如SQL)中应用的新函数。Apache Spark也不例外,其为UDF与Spark SQL工作流集成提供了各种选项。 在本篇博文中,我们将回顾Python、Java和Scala上的Apache Spark UDF和UDAF(用户自定义的聚合函数)实现的简单示...

2019-06-14 10:46:45 110

转载 在Apache Spark中使用UDF

用户自定义函数(UDF)是大多数SQL环境的一个关键特性,其主要用于扩展系统的内置功能。UDF允许开发人员通过抽象其低级语言实现在更高级语言(如SQL)中应用的新函数。Apache Spark也不例外,其为UDF与Spark SQL工作流集成提供了各种选项。 在本篇博文中,我们将回顾Python、Java和Scala上的Apache Spark UDF和UDAF(用户自定义的聚合函数)实现的简单示...

2019-06-14 10:46:42 163

转载 在ZooKeeper组件上停用JMX agent之后如何允许cm继续监控ZooKeeper的运行状态

摘要In TSB 2019-310 the workaround we asked users to do was to disable Zookeeper monitoring. However turning off the monitoring of Zookeeper service can be risky. This article explain the workaround whi...

2019-06-05 11:59:45 250

转载 CDH初期集群构建方案建议

集群规模计算集群规模取决于用户数据及应用需求,最终规划值为以下各种计算方式得出的最小集群规模的最大值• 容量需求– 估算相对容易且准确– 大多数案例可以通过容量来决定集群规模• 计算需求– 准确的估算计算资源只能通过小规模测试并合理估算• 其他资源限制– 如用户MapReduce应用可能对内存等资源有特殊要求,且单节点可配置资源相对有限,则集群最小规模需满足用户此类资...

2019-06-04 10:55:12 203

转载 Cloudera Manager和CDH升级流程

1.Cloudera升级概述 升级包括两个主要的步骤,升级Cloudera Manager和升级CDH群集 升级CM: *升级CM时 可以使用rpm命令; Cloudera Manager升级时,Cloudera Navigator也会升级。 升级CDH: *CM和CDH不需要同时升级,但CM和CDH的版本必须兼容。Cloudera Manager 6.0可以管理运行CDH 5.7到CDH 5.1...

2019-06-03 14:05:46 323

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除