自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (2)
  • 收藏
  • 关注

原创 Ambari 主机链接显示和跳转问题

背景华为云Ambari HDP大数据集群迁移,用的华为整机镜像方式,记录一些不常见的问题。Q1:ambari 页面主机链接显示问题/服务器对外主机名,无法跳转正常情况这里应该显示设置后的主机名,但这里显示的是服务器对外的主机名A:修改 public_host_name 获取方式sudo vim /usr/lib/ambari-agent/lib/ambari_agent/hostname.py 98 try: 99 handle = urllib2.urlopen('http:/

2021-10-28 10:55:03 492

原创 Atlas元数据-集成sqoop

Atlas集成Sqoopatlas集成sqoop文档较少 简单写一下,sqoop hook 与hive hook是相辅相成的environment:CDH:6.2.0sqoop:1.4.7Atlas:2.0.0Hive:2.1.11. 配置 sqoop-site.xml我用的cdh版本:2.配置Atlas1.确保/atlas/apache-atlas-2.0.0/hook/sqoop文件,没有看我部署篇 atlas-plugin-classloader-2.0.0.jar at

2020-08-11 17:16:06 1499 1

原创 元数据 - Amundsen

推荐一款新得元数据管理工具 Amundsen美国lyft公司开源,项目地址还是比较活跃的,只是目前不支持血缘关系。

2020-08-05 15:51:52 983

原创 Atlas元数据-安装部署

Atlas 元数据 - 安装编译记录下经过的坑1、atlas 编译1.1 编译环境要求:*****2、执行3、粘贴一些还记得的报错3.1、The web address you're looking for is not a functioning page in Apache Atlas3.2、Exception in thread "main" java.lang.NoSuchMethodError: org.apache.hadoop.hive.metastore.api.Database.getCa

2020-08-05 15:26:31 1169

原创 spark 调用 janusgraph 问题汇总

用spark调用janusgraph 会有一个小问题,在此记录下,如果对读者有帮助那最好了。1.图已经创建并写入了数据,通过spark 找不到图,或者GraphComputer,图形是空的。Caused by: com.netflix.astyanax.connectionpool.exceptions.BadRequestException背景: 官方文档建议建议用cql来连接Janusgr...

2019-01-11 14:02:48 2478 4

原创 ES 自定义分词

由于项目需求,需要对化学式分词,特此记录示例为空格分词主要继承Tokenizer 重写 incrementToken方法package org.elasticsearch.gridsum.plugin.extend;import org.apache.logging.log4j.LogManager;import org.apache.logging.log4j.Logger;imp...

2018-10-23 17:22:25 631

翻译 JanusGraph 诸神图示例

形成图谱如下:源码:import com.google.common.base.Preconditions;import org.janusgraph.core.EdgeLabel;import org.janusgraph.core.Multiplicity;import org.janusgraph.core.PropertyKey;import org.janusg...

2018-09-14 17:36:34 3297

翻译 图数据库 JanusGraph

图数据库 JanusGraph知识图谱1.什么是知识图谱知识图谱:是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。2.知识图谱应用知识图谱的应用场景非常广泛:场景一 新闻事件的关联分析场景二 识别反欺诈潜在风险场景三 不一致性验证识别场景四 失联客户管理场景五 ...

2018-09-14 17:23:13 2721

原创 JavaSpark 自定义累加器

JavaSpark 自定义累加器实现import org.apache.spark.util.AccumulatorV2;import scala.runtime.BoxedUnit;import java.util.*;/** * @description: 自定义累加器 * 拓展 String、List、Map * @author: Mr.杜子...

2018-07-30 17:17:34 1349

原创 PySpark调用Java UDAF

Use Java UDAF in PySparkJavaimport org.apache.spark.sql.Row;import org.apache.spark.sql.expressions.MutableAggregationBuffer;import org.apache.spark.sql.expressions.UserDefinedAggregateFunc...

2018-07-30 16:43:54 1559 4

clouder-cdh-6.2.1 离线安装包

本资源包为 cdh6.2.1 redhat7 版本 # 目录结构如下 ├── cdh6 │   └── 6.2.1 │   └── parcels │   ├── CDH-6.2.1-1.cdh6.2.1.p0.1425774-el7.parcel │   ├── CDH-6.2.1-1.cdh6.2.1.p0.1425774-el7.parcel.sha1 │   └── manifest.json └── cm6 └── 6.2.1 ├── allkeys.asc └── redhat7 └── yum ├── cloudera-manager.repo ├── RPM-GPG-KEY-cloudera └── RPMS └── x86_64 ├── cloudera-manage

2022-02-09

ES与大数据平台集成资料

文档描述了Elasticsearch整合大数据平台具体方法

2018-12-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除