大数据
深夜奶爸
这个作者很懒,什么都没留下…
展开
-
Ambari 安装 HDP(Centos7,HDP-2.6.3.0-235,HDP-UTILS-1.1.0.21,ambari-2.6.0.0)
构建Ambari 安装HDP环境大致包含这几个步骤(1) SSH免密登陆(2) hosts配置(所有机器必须执行)(3) 防火墙管理 (所有机器必须执行)(4) 安装JDK (所有机器必须执行)(5) 构建本地yum源(master 主机安装)(6) 安装mysql (master 主机安装)(7) 初始化Ambari和HDP库 (master 主机)(8) 安装Ambari (m...原创 2018-10-10 17:50:30 · 2162 阅读 · 0 评论 -
spring boot +hadoop做文件上传
最近需要spark进行文件处理,需要提交数据到spark上就想着通过http 把文件上传到hdfs上,在进行数据计算 public class HDFSCommon { static public void copyfileToHdfs(Configuration config, String url, File file) { try { ...原创 2018-08-16 11:41:19 · 4459 阅读 · 3 评论 -
docker内构建开源对象存储(minio)
前段时间做了一个项目,客户无法将数据拿到外网,只能通过在内网构建OSS对象存储,我们本身依赖极道的平台来做业务,他们采用了s3的标准,就采用minio来构建开源的OSS对象存储空间,其实很简单docker pull minio/minio 从仓库拉镜像docker run -p 9000:9000 --name minio1 -e “MINIO_ACCESS_KEY=AKIAIOSFODNN...原创 2019-01-28 15:21:28 · 1421 阅读 · 0 评论 -
spring boot整合scala和spark做大数据预言
原来用jetty 和 restful 做过驱动spark的计算框架,最近想用spring boot +scala + spark 重新做一个,一下是pom.xml 和代码分享pom.xml<?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns...原创 2019-04-01 18:09:11 · 4476 阅读 · 0 评论