自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

尘土的博客

宁静致远,遇见自己!

  • 博客(14)
  • 资源 (1)
  • 收藏
  • 关注

原创 Harbor - Docker私有仓库安装部署

Harbor是一个用于存储和分发Docker镜像的企业级Registry服务器,通过添加一些企业必需的功能特性,例如安全、标识和管理等,扩展了开源Docker Distribution。作为一个企业级私有Registry服务器,Harbor提供了更好的性能和安全。提升用户使用Registry构建和运行环境传输镜像的效率。Harbor支持安装在多个Registry节点的镜像资源复制,镜像全部保存在私有Registry中, 确保数据和知识产权在公司内部网络中管控。

2018-09-27 13:39:17 577

原创 基于ambari 2.6.2.0的docker镜像安装大数据服务组件

之前有使用docker搭建了一套Apache Hadoop版本的大数据平台,参考我的码云地址:https://gitee.com/elbertmalone/HadoopHACluster,整个编写脚本和搭建过程花了很多时间,且灵活性不好。Ambari在大数据集群部署方面有得天独厚的优势,但是集群操作系统安装准备工作以及基础包的安装还是需要花费很多的时间。为了节省大数据集群的部署时间接下来我们用Do...

2018-09-11 17:17:37 3064

原创 在Docker中CentOS7镜像使用systemctl命令方法

在Docker中CentOS7镜像使用systemctl命令方法

2018-09-06 17:19:37 5041 1

原创 CentOS7下安装Anaconda3和Tensorflow

TensorFlow™ 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。它灵活的架构让你可以在多种平台上展开计算,例如台式计算机中的一个或多个CPU(或GPU),服务器,移动设备等等。TensorFlow 最初由Google大脑小组(隶属于Google机器智能研究

2017-12-07 13:12:36 10581

原创 Alluxio 1.6.1的安装部署

Alluxio是一个基于内存的分布式文件系统,它是架构在底层分布式文件系统和上层分布式计算框架之间的一个中间件,主要职责是以文件形式在内存或其它存储设施中提供数据的存取服务。

2017-11-09 11:46:03 524

原创 Hadoop2.x基本原理与架构

Apache Hadoop 是一个开源软件框架,可安装在一个商用机器集群中,使机器可彼此通信并协同工作,以高度分布式的方式共同存储和处理大量数据。最初,Hadoop 包含以下两个主要组件:Hadoop Distributed File System (HDFS) 和一个分布式计算引擎,该引擎支持以 MapReduce 作业的形式实现和运行程序。

2016-10-24 01:29:47 3531

原创 MarkDown使用pandoc转PDF和Word文档

Pandoc是由John MacFarlane开发的标记语言转换工具,可实现不同标记语言间的格式转换,堪称该领域中的“瑞士军刀”。Pandoc使用Haskell语言编写,以命令行形式实现与用户的交互,可支持多种操作系统;Pandoc采用GNU GPL授权协议发布,属于自由软件。

2016-10-19 13:22:09 9238

原创 MapReduce实例之PageRank

PageRank,即网页排名,又称网页级别、Google左侧排名或佩奇排名。        是Google创始人拉里·佩奇和谢尔盖·布林于1997年构建早期的搜索系统原型时提出的链接分析算法,自从Google在商业上获得空前的成功后,该算法也成为其他搜索引擎和学术界十分关注的计算模型。目前很多重要的链接分析算法都是在PageRank算法基础上衍生出来的。PageRank是Google用于用来标识网页的等级/重要性

2016-09-26 08:25:16 804

原创 MongoDB与Hadoop结合之使用MapReduce官方实例

Hadoop 是一个开源的分布式的并行计算系统,其Map/Reduce 运算功能被广泛地应用在数据分析领域。mongo-hadoop 是一个将MongoDB 与Hadoop 相整合的开源工具。

2016-09-14 11:12:50 4046

原创 MongoDB实现分片复制集

MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。他支持的数据结构非常松散,是类似json的bson格式,因此可以存储比较复杂的数据类型。Mongo最大的特点是他支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。

2016-08-31 13:08:07 3408

原创 Hive基于MySQL保存元数据的安装

hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。

2016-08-28 14:09:12 799

原创 使用MongoDB实现分片集

分片非常适用于基于云的计算平台,由MongoDB实现的分片非常擅长以动态和负载敏感的方式自动调整规模,可以在需要的时候增大容量,同时也可以减少容量。

2016-08-26 15:10:15 754

原创 MongoDB实现复制集

复制集由一个主服务器、多个辅助服务器(从主服务器复制写操作)或仲裁服务器组成

2016-08-24 16:34:16 710

原创 pymongo-3.3.0下载和安装

pymongo-3.3.0下载和安装1. 给Linux用户添加sudo权限2. pymongo-3.3.0下载3. pymongo-3.3.0解压4. pymongo-3.3.0安装

2016-08-24 11:59:34 1339

Scrum权威指南

Scrum 是用于开发、交付和持续支持复杂产品的一个框架。本指南包含了 Scrum 的定义,其中包括 Scrum 的角色、事件、工件,以及把它们组织在一起的规则。 Ken Schwaber 和 Jeff Sutherland 创造了 Scrum, Scrum 指南也由他们撰写并提供。总之,他们是 Scrum 指南的后盾。

2018-03-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除