2019年11月_一尘在心

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

转载 LVS负载均衡（LVS简介、三种工作模式、十种调度算法）

一、LVS简介 LVS（Linux Virtual Server）即Linux虚拟服务器，是由章文嵩博士主导的开源负载均衡项目，目前LVS已经被集成到Linux内核模块中。该项目在Linux内核中实现了基于IP的数据请求负载均衡调度方案，其体系结构如图1所示，终端互联网用户从外部访问公司的外部负载均衡服务器，终端用户的Web请求会发送给LVS调度器，调度器根据自己预设的算法决定将该...

2019-11-26 15:43:27 206

原创把class文件打包成jar包

一、少量class打包成jar1、进入cmd，切换到java bin目录2、输入：jar cvf (新jar的名字) (.class文件，多个则中间用空格隔开)如： jar cvf test.jar test.class test2.class二、多个class文件，以及文件夹(1)新建一个manifest.txt文件，添加内容：Manifest-Versio...

2019-11-11 11:07:50 4723

原创 Mysql之一主多从复制

简介将master数据库中的DDL和DML操作通过二进制日志（BINLOG）传输到slave数据库上，然后将这些日志重新执行（重做）；从而使得slave数据库的数据与master数据库保持一致。MySQL数据库自身提供的主从复制功能可以方便的实现数据的多处自动备份，实现数据库的拓展。多个数据备份不仅可以加强数据的安全性，通过实现读写分离还能进一步提升数据库的负载性能。目录一、主从原...

2019-11-08 17:47:21 1401

转载 windows上 IntelliJ IDEA安装scala环境详细初学

https://blog.csdn.net/csdn_dengfan/article/details/88363224

2019-11-07 15:44:19 255

转载 Java8 特性详解（二） Stream API

文章目录1. 为什么需要 Stream 2. Stream的流程 3. 创建Stream 3.1. 使用Collection子类获取Stream 3.2. 使用Stream静态方法of来创建Stream 3.3. 使用Stream静态方法generate来创建Stream 3.4. 使用Stream静态方法iterate来创建Stream 4. 流转换 4.1. di...

2019-11-07 14:50:34 823

转载 Java8 特性详解（一） Lambda

文章目录1. 为什么要使用lambda表达式 2. 从函数式接口说起 3. lambda表达式的语法糖 3.1. 语法糖 3.2. 注意点 4. 方法引用 4.1. 对象：：实例对象 4.2. 类：：实例对象 4.3. 对象：：静态方法 4.4. 构造器引用 5. 变量作用域 6. 接口的静态方法 >>> 加入全国服务端技术社群「...

2019-11-07 11:41:46 204

转载 Spark学习之路（二十三）SparkStreaming的官方文档

目录一、SparkCore、SparkSQL和SparkStreaming的类似之处二、SparkStreaming的运行流程 2.1　图解说明 2.2　文字解说三、SparkStreaming的3个组成部分四、　离散流（DStream）五、小栗子 5.1　简单的单词计数 5.2　监控HDFS上的一个目录 5.3　第二次运行的时候更新原先的结果 5.4　...

2019-11-07 09:38:23 193

原创 Spark学习之路（二十）SparkSQL的元数据

目录一、概述二、Spark-SQL脚本正文回到顶部一、概述SparkSQL 的元数据的状态有两种：1、in_memory,用完了元数据也就丢了2、hive , 通过hive去保存的，也就是说，hive的元数据存在哪儿，它的元数据也就存在哪儿。　换句话说，SparkSQL的数据仓库在建立在Hive之上实现的。我们要用SparkSQL去构建数据仓库的时候，必...

2019-11-07 09:37:34 617

原创 Spark学习之路（二十七）图简介

目录一、图 1.1　基本概念二、术语 2.1　顶点和边 2.2　有向图和无向图 2.3　有环图和无环图 2.4　度、出边、入边、出度、入度 2.5　超步三、图处理技术 3.1　图数据库 3.2　图数据查询 3.3　图数据分析 3.4　图数据可视化正文回到顶部一、图1.1　基本概念图是由顶点集合(vertex)及...

2019-11-07 09:33:55 240

原创 Spark学习之路（二十八）分布式图计算系统

目录一、引言二、图存储模式 2.1　边分割（Edge-Cut） 2.2　点分割（Vertex-Cut） 2.3　对比三、图计算模式 3.1　超步 3.2　Pregel模型——像顶点一样思考 3.3　GAS模型——邻居更新模型正文回到顶部一、引言　　在了解GraphX之前，需要先了解关于通用的分布式图计算框架的两个常见问题：图存储模式和图计...

2019-11-07 09:32:05 614

转载 Spark学习之路（十九）SparkSQL的自定义函数UDF

在Spark中，也支持Hive中的自定义函数。自定义函数大致可以分为三种：UDF(User-Defined-Function)，即最基本的自定义函数，类似to_char,to_date等 UDAF（User- Defined Aggregation Funcation），用户自定义聚合函数，类似在group by之后使用的sum,avg等 UDTF(User-Defined Table-G...

2019-11-07 09:31:06 161

转载 Spark学习之路（十八）SparkSQL简单使用

目录一、SparkSQL的进化之路二、认识SparkSQL 2.1　什么是SparkSQL? 2.2　SparkSQL的作用 2.3　运行原理 2.4　特点 2.5　SparkSession 2.7　DataFrames 三、RDD转换成为DataFrame 3.1　方式一：通过case class创建DataFrames（反射） 3.2　方式...

2019-11-06 16:59:56 133

转载 Spark学习之路（十七）Spark分区

目录一、分区的概念二、为什么要进行分区三、Spark分区原则及方法 3.1　本地模式 3.2　YARN模式四、分区器正文回到顶部一、分区的概念　　分区是RDD内部并行计算的一个计算单元，RDD的数据集在逻辑上被划分为多个分片，每一个分片称为分区，分区的格式决定了并行计算的粒度，而每个分区的数值计算都是在一个任务中进行的，因此任务的个数，也是由RDD(准...

2019-11-06 16:47:15 237

转载 Spark学习之路（十六）SparkCore的源码解读（二）spark-submit提交脚本

目录一、概述二、源码解读 2.2　find-spark-home 2.3　spark-class 2.4　SparkSubmit 正文回到顶部一、概述上一篇主要是介绍了spark启动的一些脚本，这篇主要分析一下Spark源码中提交任务脚本的处理逻辑，从spark-submit一步步深入进去看看任务提交的整体流程,首先看一下整体的流程概要图：回到顶部...

2019-11-06 16:21:33 203

转载 Spark学习之路（十五）SparkCore的源码解读（一）启动脚本

目录一、启动脚本分析 1.1　start-all.sh 1.2　start-master.sh 1.3　spark-config.sh(1.2的第5步) 1.4　load-spark-env.sh(1.2的第6步) 1.5　spark-env.sh 1.6　spark-daemon.sh 1.7　spark-class 1.8　start-slaves.sh...

2019-11-06 16:14:00 164

原创 Spark学习之路（十四）SparkCore的调优之资源调优JVM的GC垃圾收集器

目录一、概述二、垃圾收集器(garbage collector (GC)) 是什么？三、为什么需要GC？四、为什么需要多种GC？五、对象存活的判断六、垃圾回收算法 6.1　标记 -清除算法 6.2　复制算法 6.3　标记-整理算法 6.4　分代收集算法七、垃圾收集器 7.1　Serial收集器 7.2　ParNew收集器 7.3　Parall...

2019-11-06 16:02:33 188

原创 Spark学习之路（十三）SparkCore的调优之资源调优JVM的基本架构

目录一、JVM的结构图 1.1　Java内存结构 1.2　如何通过参数来控制各区域的内存大小 1.3　控制参数 1.4　JVM和系统调用之间的关系二、JVM各区域的作用 2.1　Java堆（Heap） 2.2　方法区（Method Area） 2.3　程序计数器（Program Counter Register） 2.4　JVM栈（JVM Stacks）...

2019-11-06 15:09:52 135

原创 Spark学习之路（十二）SparkCore的调优之资源调优

目录一、概述二、Spark作业基本运行原理三、资源参数调优 3.1　num-executors 3.2　executor-memory 3.3　executor-cores 3.4　driver-memory 3.5　spark.default.parallelism 3.6　spark.storage.memoryFraction 3.7　spark.shu...

2019-11-06 14:43:17 111

原创 Spark学习之路（十一）SparkCore的调优之Spark内存模型

目录一、概述二、堆内和堆外内存规划 2.1　堆内内存 2.2　堆外内存 2.3　内存管理接口三、内存空间分配 3.1　静态内存管理 3.2　统一内存管理四、存储内存管理 4.1　RDD 的持久化机制 4.2　RDD 缓存的过程 4.3　淘汰和落盘五、执行内存管理 5.1　多任务间内存分配 5.2　Shuffle 的内存占用 ...

2019-11-06 11:45:55 182

原创 Spark学习之路（十）SparkCore的调优之Shuffle调优

目录一、概述二、shuffle的定义三、ShuffleManager发展概述四、HashShuffleManager的运行原理 4.1　未经优化的HashShuffleManager 4.2　优化后的HashShuffleManager 五、SortShuffleManager运行原理 5.1　普通运行机制 5.2　bypass运行机制六、shuffle相...

2019-11-06 10:23:53 141

转载 Spark学习之路（九）SparkCore的调优之数据倾斜调优

目录调优概述数据倾斜发生时的现象数据倾斜发生的原理如何定位导致数据倾斜的代码某个task执行特别慢的情况某个task莫名其妙内存溢出的情况查看导致数据倾斜的key的数据分布情况数据倾斜的解决方案解决方案一：使用Hive ETL预处理数据解决方案二：过滤少数导致倾斜的key 解决方案三：提高shuffle操作的并行度解决方案四：两阶段聚合（局...

2019-11-06 10:22:57 108

转载 Spark学习之路（八）SparkCore的调优之开发调优

目录调优概述原则一：避免创建重复的RDD 一个简单的例子原则二：尽可能复用同一个RDD 一个简单的例子原则三：对多次使用的RDD进行持久化对多次使用的RDD进行持久化的代码示例 Spark的持久化级别如何选择一种最合适的持久化策略原则四：尽量避免使用shuffle类算子 Broadcast与map进行join代码示例原则五：使用map-s...

2019-11-05 18:34:28 136

原创 Spark技术原理

https://blog.csdn.net/qq_38265137/article/details/80547745

2019-11-05 17:29:56 126

转载 Spark（三）RDD与广播变量、累加器

一、RDD的概述1.1 什么是RDDRDD（Resilient Distributed Dataset）叫做弹性分布式数据集，是Spark中最基本的数据抽象，它代表一个不可变、可分区、里面的元素可并行计算的集合。RDD具有数据流模型的特点：自动容错、位置感知性调度和可伸缩性。RDD允许用户在执行多个查询时显式地将工作集缓存在内存中，后续的查询能够重用工作集，这极大地提升了查询速度。1...

2019-11-05 13:55:26 330

转载 Spark（二）CentOS7.5搭建Spark2.3.1分布式集群

一下载安装包1官方下载官方下载地址：http://spark.apache.org/downloads.html2 安装前提Java8 安装成功 zookeeper 安装参考：CentOS7.5搭建Zookeeper3.4.12集群 hadoop 安装参考：CentOS7.5搭建Hadoop2.7.6集群 Scala ...

2019-11-05 11:06:23 146

原创 Spark（一）Spark简介

一、官网介绍1 什么是Spark官网地址：http://spark.apache.org/Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行计算框架，Spark拥有Hadoop MapReduce所具有的优点；但不同于M...

2019-11-05 11:03:25 962

原创 Springboot 集成 Thrift

https://blog.csdn.net/rui15111/article/details/95332611

2019-11-01 15:23:44 901

原创 centos7安装Thrift

1、安装依赖yum -y install automake libtool flex bison pkgconfig gcc-c++ boost-devel libevent-devel zlib-devel python-devel ruby-devel openssl-devel2、安装thriftwget "http://mirror.bit.edu.cn/apache/thr...

2019-11-01 10:01:11 559

分类算法朴素贝叶斯-NB.pdf

内有NB(朴素贝叶斯)对应的知识要点，为巴豆大数据团队讲师课件，内容丰富，知识覆盖全面，可以直接使用。内有NB(朴素贝叶斯)对应的知识要点，为巴豆大数据团队讲师课件，内容丰富，知识覆盖全面，可以直接使用。

2020-02-20

巴豆大数据团队讲师课件Yarn.pdf

内有Hadoop对应的知识要点，为巴豆大数据团队讲师课件，内容丰富，知识覆盖全面，可以直接使用。内有Yern对应的知识要点，为巴豆大数据团队讲师课件，内容丰富，知识覆盖全面，可以直接使用。

2020-02-20

巴豆大数据团队讲师课件HDFS.pdf

内有Hadoop对应的知识要点，为巴豆大数据团队讲师课件，内容丰富，知识覆盖全面，可以直接使用。

2020-02-20

巴豆大数据团队讲师课件Spark.pdf

内有Spark对应的知识要点，为巴豆大数据团队讲师课件，内容丰富，知识覆盖全面，可以直接使用。

2020-02-20

巴豆大数据团队讲师课件Hive.pdf

内有Hive对应的知识要点，为巴豆大数据团队讲师课件，内容丰富，知识覆盖全面，可以直接使用。

2020-02-20

巴豆大数据团队讲师课件Flume.pdf

内有Flume对应的知识要点，为巴豆大数据团队讲师课件，内容丰富，知识覆盖全面，可以直接使用。

2020-02-20

巴豆大数据团队讲师课件Hbase.pdf

内有Hbase对应的知识要点，为巴豆大数据团队讲师课件，内容丰富，知识覆盖全面，可以直接使用。内有Hbase对应的知识要点，为巴豆大数据团队讲师课件，内容丰富，知识覆盖全面，可以直接使用。

2020-02-19

卸载Windows10deuninstall_edge.zip

1. 下载文件 2. 解压文件 3. 右击 Uninstall Edge.cmd，选择以管理员身份运行 4. 等待运行完成，然后重启计算机即可

2020-02-12

运行维护管理体系和制度规范.doc

本实施细则以ITIL/ISO20000为基础，以信息化项目的运维为目标，以管理支撑工具为手段，以流程化、规范化、标准化管理为方法，以全生命周期的PDCA循环为提升途径，体现了对运维服务全过程的体系化管理。

2020-01-07

cmmi3项目管理全套模板，保护整个项目周期，可以直接套用，内有：0-16章节分别为 0：文档评审总结 1：项目管理过程 2：质量与分析过程 3：质量保证过程 4：配置管理过程 5：评审过程 6：决策与分析过程 7：培训过程 8：组织过程管理 9：需求管理过程 10：需求收集过程 11：需求分析过程 12：设计过程 13：编码与单元测试过程 14：集成与系统测试过程 15：软件实施过程 16：外包管理过程

2019-12-16

CMMI3（1-21章节）.zip

封面要有方针的审批记录 1.CMMI标准过程集中所有文档的初次发布时间要统一,封面要统一改成公司的标识 2.每个过程定义、模板、指南等要求至少修改三次检查 3：内有1-21章节完成资料请放心下载

2019-12-16

GAT 1400-2017公安视频图像信息应用系统.zip

GAT 1400-2017 公安视频图像信息应用系统（包含1-4全部），第1部分：通用技术要求，第2部分：应用平台技术要求，第3部分：数据库技术要求，第4部分：接口协议要求内有文档和上下级系统级联联网结构图.。请放心下载

2019-12-16

Spark思维导图.xmind

内有Spark 超级详细的思维导图下载后用xmind 打开即可

2019-09-01

mysqlyl.zip

内有rpm安装mysql 5.7所有依赖包本人已经亲测测过里面的依赖包都是亲自整理放心使用

2019-08-19

keepalived2.0.8

keepalived2.0.8 也可以上官网下载安装 Keepalived (http://www.keepalived.org/download.html)

2019-08-16

nginxYL.zip

里面有离线安装keepalived nginx 所需要的所有所有rpm包亲自搭建有效

2019-08-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

分类算法朴素贝叶斯-NB.pdf

巴豆大数据团队讲师课件Yarn.pdf

巴豆大数据团队讲师课件HDFS.pdf

巴豆大数据团队讲师课件Spark.pdf

巴豆大数据团队讲师课件Hive.pdf

巴豆大数据团队讲师课件Flume.pdf

巴豆大数据团队讲师课件Hbase.pdf

卸载Windows10deuninstall_edge.zip

运行维护管理体系和制度规范.doc

cmmi3完整版全套模板最新版.zip

CMMI3（1-21章节）.zip

GAT 1400-2017公安视频图像信息应用系统.zip

Spark思维导图.xmind

mysqlyl.zip

keepalived2.0.8

nginxYL.zip

空空如也