分布式理论
文章平均质量分 52
分布式理论
hailunw
这个作者很懒,什么都没留下…
展开
-
搭建Eclipse+Spark开发环境
1)下载安装Eclipse2)安装Scala IDE for Eclipse原创 2021-08-15 11:45:30 · 413 阅读 · 0 评论 -
Webservice简介
简介RPC(Remote Procedure Call,远程过程调用),通常包含两个部分,序列化和通信协议。常用序列化协议包括json,xml,hession,protobuf,thrift,text,bytes等。当前常用远程通信技术包括基于HTTP的RESTful和基于TCP的RPC协议。RESTful接口RESTful,是Representation State Transfer的缩写。它包含以下概念。资源(Resource),表示网络上的一个实体(文本,图片,歌曲,服务,等)原创 2021-08-11 18:18:45 · 2451 阅读 · 0 评论 -
微服务简介
简介Spring Cloud是一系列框架的有序集合,是一种常见的微服务框架。同类产品有ServiceComb,ZeroC ICE等。Spring Cloud基于SpringBoot的开发便利性,简化了分布式系统基础设施的开发,如服务发现注册,配置中心,消息总线,负载均衡,断路器,数据监控等,都可以以SpringBoot的开发风格做到一键启动和部署。...原创 2021-08-11 18:01:42 · 190 阅读 · 0 评论 -
分布式系统锁实现方案简介
1)原创 2021-08-11 08:32:23 · 121 阅读 · 0 评论 -
分布式系统唯一id生成方案简介
1)原创 2021-08-11 08:31:45 · 117 阅读 · 0 评论 -
Nginx的简介以及安装
1)简介2)安装原创 2021-07-20 15:29:33 · 200 阅读 · 1 评论 -
FastDFS的简介和安装
1)FastDFS的简介FastDFS是一个开源的轻量级分布式文件系统,它对文件进行管理,功能包括:文件存储、文件同步、文件访问(文件上传、文件下载)等,解决了大容量存储和负载均衡的问题。特别适合以文件为载体的在线服务,如相册网站、视频网站等等。FastDFS为互联网量身定制,充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标,使用FastDFS很容易搭建一套高性能的文件服务器集群提供文件上传、下载等服务。2)FastDFS的安装步骤2.1)安装gccyumi.原创 2021-07-20 13:44:23 · 345 阅读 · 0 评论 -
Redis的简介以及简单应用
Redis的简介以及简单应用原创 2021-07-10 07:39:42 · 91 阅读 · 0 评论 -
HIVE中UDTF的使用
HIVE中UDTF的使用原创 2021-07-08 17:12:37 · 134 阅读 · 0 评论 -
大数据项目实战---电商埋点日志分析(第三部分,DWD层初步解析)
构建DWD层往DWD层加载数据原创 2021-07-08 13:41:46 · 399 阅读 · 1 评论 -
Docker简介
Docker简介原创 2021-07-06 23:20:45 · 94 阅读 · 1 评论 -
Puppet的安装以及简单示例
1)在主服务器99上下载安装Puppetyum install puppet原创 2021-07-06 21:13:11 · 609 阅读 · 1 评论 -
Puppet简介
Puppet是一种Linux、Unix、windows平台的集中配置管理系统,使用自有的Puppet描述语言,可管理配置文件、用户、cron任务、软件包、系统服务等。puppet把这些系统实体称之为资源,Puppet的设计目标是简化对这些资源的管理以及妥善处理资源间的依赖关系。Puppet采用C/S星状的结构,所有的客户端和一个或几个服务器交互。每个客户端周期的(默认半个小时)向服务器发送请求,获得其最新的配置信息,并且严格按照配置文件来配置客户端,保证和该配置信息同步。配置完成以后,Puppet客户端原创 2021-07-06 20:44:24 · 534 阅读 · 0 评论 -
kubernetes简介
Kubernetes的概念以及特点Kubernetes是Google团队的一个开源项目,它的目标是管理跨多个主机的容器,提供基本的部署,维护以及应用伸缩,主要实现语言是go语言。kafka也是go语言。Kubernetes具有,易学(轻量级,简单容易理解),便携(支持公有云私有云和混合云),可扩展(模块化,可插拔),自动重调度重启和复制。分布式的基本操作是部署,调度以及伸缩。Kubernetes的常用术语节点(Node),一个节点是一个运行Kubernetes的主机。容器组(Pod),原创 2021-07-06 20:39:05 · 152 阅读 · 2 评论 -
分布式系统监控软件Ganglia的安装和配置
1)在66服务器(主服务器)上下载安装监控软件Ganglia。yum install -y epel-release ganglia-gmetad ganglia-devel ganglia-gmond rrdtool httpd ganglia-web php4)在88和99服务器(非主服务器)上下载安装监控软件ganglia。yum install -y epel-release gmond ganglia-gmond5) 在66服务器上作如下配置。 [root@Ne...原创 2021-07-03 17:27:14 · 161 阅读 · 0 评论 -
Spark中RDD,Dstream,DataSet,DataFrame简介
DataFrameDataSet原创 2021-06-27 10:15:53 · 416 阅读 · 0 评论 -
Streaming 流式计算的模式
原生流模式(Native)微批处理原创 2021-06-27 09:42:50 · 148 阅读 · 0 评论 -
Spark原理----术语
内核术语:宽依赖:通常在shuffle之前,比如一个操作只依赖之前的一个操作。窄依赖:比如在shuffle阶段,需要等待前面所有的操作完成之后才可以进行shuffle操作。DAG,有向无环图,在spark中指代spark程序任务的流程图。DAG的开始是从创建RDD开始,DAG的结束是到Action(比如saveAsTextFile)结束。...原创 2021-06-27 09:08:38 · 130 阅读 · 0 评论 -
Spark的安装配置(本地模式,standalone模式,standalone HA模式,on-yarn模式)
1)Standalone模式2)HA集群模式3)Yarn模式原创 2021-06-25 09:42:42 · 382 阅读 · 0 评论 -
Spark简介
Spark是一个大数据领域统一数据分析框架, 速度快,使用简单,通用性,可以运行任何地方。原创 2021-06-25 08:59:00 · 152 阅读 · 0 评论 -
ElasticSearch简介
ElasticSearch是Java开发并且是当前最流行的开源的企业级搜索引擎,能够达到近实时搜索,稳定可靠快速安装使用方便。客户端支持Java, .net各种编程语言。ElasticSearch底层原理:原创 2021-06-23 16:11:56 · 374 阅读 · 2 评论 -
[需要继续修改]MongoDB的简介
MongoDB的使用场景:传统数据库MySQL无法胜任的三高(High Performance, High Storage, High Scalability)场景。High Performance, 对数据库高并发读写。High Storage,对海量数据的高效率存储和访问需求。High Scalability&Availability,对数据库的高可扩展和高可用。具体场景:1)社交场景,使用MongoDB存储用户信息以及朋友圈信息地理位置等。2)游戏场景,使用MongoD原创 2021-06-23 10:52:14 · 93 阅读 · 0 评论 -
Zookeeper简介及安装,以及Hadoop的HA集群(hdfs的namenode和yarn的resourcemanager)配置
Zookeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。Zo...原创 2021-06-14 18:42:05 · 459 阅读 · 2 评论 -
HIVE以及MySQL的安装配置
1)卸载已安装的mysql2)安装mysql原创 2021-06-13 16:01:21 · 407 阅读 · 0 评论 -
HIVE简介
HIVEFacebook开源用于解决海量结构化日志的数据统计,是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。本质是将HQL转化成MapReduce程序。原创 2021-06-13 12:28:39 · 229 阅读 · 0 评论 -
Kafka简介及安装
Kafka是一个分布式的基于发布/订阅模式的消息队列,主要应用于大数据实时处理领域。原创 2021-06-11 13:41:45 · 121 阅读 · 1 评论 -
HDFS配置lzo压缩
Flume最初是Cloudera开发的实时日志收集系统,2011年10月22日Cloudera对Flume进行了里程碑式的改动,重构核心组件,核心配置以及代码架构,并将其纳入了Apache转载 2021-06-11 09:50:48 · 512 阅读 · 0 评论 -
分布式与传统的对比简介
分布式存储简介原创 2021-06-09 16:57:20 · 1861 阅读 · 0 评论 -
DAS SAN NAS的简介
分布式计算简介原创 2021-06-09 16:56:33 · 116 阅读 · 0 评论