自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 资源 (2)
  • 收藏
  • 关注

原创 自制证书nextcloud打开onlyoffice报错问题解决办法

首先,nextcloud和onlyoffice都需要改成https,这个可以参考我另一篇写的很粗糙的文章,主要遇到的问题就是其他用户终端无法打开office,只有管理员能打开,也就是调试机能打开。后来在没有打开的终端中访问了一下onlyoffice,再回来打开nextcloud中的office,居然成功了,也可以新建,后来才反应过来,是因为自建证书未受信的原因。两种办法,一种是将证书给客户让用户每台电脑都在浏览器添加onlyoffice证书,另一种就是让他们先访问一下onlyoffice主页即可。

2023-11-11 19:51:46 403 1

原创 Nextcloud docker 版安装部署 自制证书https访问 添加onlyoffice以及调优解决概览报错

Nextcloud docker 版安装部署自制证书https访问 添加onlyoffice以及调优解决概览报错

2023-11-09 20:32:34 1830

原创 Dokcer离线rpm包20.10.9

Docker离线rpm包下载20.10.9

2023-10-31 16:29:14 58

原创 联想ThinkPad x1carbon 7th,i5 8265安装win7踩过的坑

最近有人让我给这台电脑装win7,预装的是win10的系统,看了下配置,觉得应该没什么问题,可装的时候遇到了很多坑,首先,我们正常就是修改bios为uefi然后再把硬盘格式改成mbr,然后直接安装就可以了,开始显示没问题,但却一直卡在安装设备到45%不动了,以往的经验是SATA没有改成achi,但是这台电脑bios并没有,不管是升级还是降级都没有。最后是怎么解决的呢,废话不多说,开始主题,具体细节不多说懂得都懂准备工作,pe,win7镜像(带nvme和usb新的镜像),还有就是去联想官网下载最新版本的b

2021-02-14 16:55:09 2902 2

原创 spark的一些重要知识点

Spark的一些重要的知识点1.spark的shuffle有几种方式shuffle过程中分为shuffle write和shuffle read,而且会在不同的stage中进行的在进行一个key对应的values的聚合时, 首先,上一个stage的每个map task就必须保证将自己处理的当前分区中的数据相同key写入一个分区文件中,可能会多个不同的分区文件,接着下一个stage的reduc...

2018-11-27 17:39:47 307

转载 kafka的一些问题总结笔记

kafka的一些问题总结笔记1.kafka在高并发的情况下,如何避免消息丢失和消息重复?kafka动态维护了一个同步状态的副本的集合(a set of In-Sync Replicas),简称ISR。在这个集合中的节点都是和leader保持高度一致的,任何一条消息只有被这个集合中的每个节点读取并追加到日志中,才会向外部通知说“这个消息已经被提交”。只有当消息被所有的副本加入到日志中时,才算...

2018-11-27 11:54:51 441

原创 Spark的笔记

#Spark中一些重要的知识点1、spark-on-yarn的应用场景​ 1.因为历史原因,方便运维部门维护,之前用的hadoop2.用yarn来运行各种任务,相比其他的资源调度系统更稳定,便于升级优化2、spark-on-yarn的执行流程​ spark-on-yarn分为两种运行模式:client和clustercluster模式:1.由client向RM提交请求,并上传jar到...

2018-11-23 20:11:42 285

转载 flume中的一些重要的知识点

flume中的一些重要的知识点##1.flume的架构client:客户端,运行agent的地方source:数据源,负责接收数据channel:管道,负责接收source端的数据,然后将数据推送到sink端sink:接收channel端的数据并且持久化到目的系统ineterceptor:拦截器,作用于source和sink,flume允许使用拦截器拦截数据selector:选择器,...

2018-11-22 10:20:23 253

原创 hbase中的一些重要的知识点

hbase中的一些重要的知识点##1.应用场景1.需要对海量非结构化的数据进行存储2.需要随机近实时的读写管理数据##2.rowKey的设计长度原则: rowkey是一个二进制流,建议rowkey的长度不要超过16个字节原因如下:(1)数据的持久化文件HFile中是按照KeyValue存储的,如果Rowkey过长比如100个字节,1000万列数据光Rowkey就要占用100*10...

2018-11-22 10:19:50 276

原创 hive的一些重要的知识点

hive的一些重要的知识点(基于Hadoop的一个数据仓库工具)基本组成:用户接口:包括 CLI、JDBC/ODBC、WebGUI。元数据存储:通常是存储在关系数据库如 mysql , derby中。解释器、编译器、优化器、执行器。1.内部表,外部表,相同与区别相同:都是表区别:内部表数据由Hive自身管理,外部表数据由HDFS管理;内部表数据存储的位置是hive.metas...

2018-11-22 10:18:34 370

原创 hadoop中的一些重要知识点

hadoop之job和shuffle过程1、job提交流程1.客户端提交作业给resourcemanager2.resourcemanager返回给客户端jobid,存储路径(HDFS上的路径)信息3.客户端将job.jar、job.xml、job.split、job.splitinfo等信息上传到存储路径(HDFS上的路径/)4.客户端通知resourcemanager可以启动job...

2018-11-22 10:17:14 230

转载 zookeeper中的主要知识点

zookeeper中的一些主要的知识点##1.应用场景1.1 什么是zookeeperZookeeper是一个分布式协调服务;就是为用户的分布式应用程序提供协调服务zookeeper是为别的分布式程序服务的Zookeeper本身就是一个分布式程序(只要有半数以上节点存活,zk就能正常服务)Zookeeper集群的角色: Leader 和 follower (Observer)...

2018-11-22 10:16:14 165

原创 hdfs的一些重要知识点

HDFS的一些重要知识点hdfs将文件存放在哪里?datanode 用户的文件存放在datanode上,放在配置的目录dfs.datanode.data.dir下namenode 管理元数据(文件路径、副本数、文件的blockid,位置等信息)##1.读写流程一、读流程1、客户端向namenode请求读取文件(指定一个路径)2、namenode查询元数据信息,看文件是否存在,...

2018-11-22 10:15:09 366

转载 [Spark源码解析]DAGScheduler划分stage

#[Spark源码解析]DAGScheduler划分stage##注意:1,DAGScheduler将Job分解成具有前后依赖关系的多个stage2,DAGScheduler是根据ShuffleDependency(宽依赖)划分stage的,3,stage分为ShuffleMapStage和ResultStage;一个Job中包含一个ResultStage及多个ShuffleMapStag...

2018-11-19 10:27:24 293

原创 Spark任务提交执行全流程详解

**任务提交执行流程**Spark任务的本质是对我们编写的RDD的依赖关系切分成一个个Stage,将Stage按照分区分批次的生成TaskSet发送到Executor进行任务的执行Spark任务分两种:1、shuffleMapTask:shuffle之后的task2、resultTask:shuffle之前的taskSpark任务分配有两种方式:1,尽量打撒方式(系统默认)2,尽...

2018-11-15 17:57:52 1887

原创 Spark集群启动流程-Worker启动-源码分析

Spark集群启动流程-Worker启动-源码分析上篇文章介绍了Master启动(Master启动点击:https://blog.csdn.net/weixin_43637653/article/details/84073849),接下来,我们在源码里继续分析Worker的启动总结:(和Master几分相似)​ 1.创建ActorSystem对象,并将初始化参数传入2.创建了...

2018-11-15 09:55:32 451

原创 Spark集群启动流程-Master启动-源码分析

集群启动流程-Master启动-源码分析总结:​ 1.初始化一些用于启动Master的参数2.创建ActorSystem对象,并启动Actor3.调用工具类AkkaUtils工具类来创建actorSystem(用来创建Actor的对象)4.创建属于Master的actor,在创建actor的同时,会初始化Master5.生命周期方法(preStart)是在构造器之后,receiv...

2018-11-14 20:51:55 948

原创 kafka中重要的知识点笔记

Kafka-消费模型High Level Consumer API不需要自己管理offset默认实现最少一次消息传递语义(At least once)comsumer数量 大于 partiton数量, 浪费。comsumer数量 小于 partiton数量, 一个comsumer对应多个partiton最好partiton数目是consumer数目的整数倍Low Level Cons...

2018-11-13 20:18:53 754 1

原创 Kafka中一些重要的组件的注意事项

Kafka中一些重要的组件的注意事项Producer(生产者)​ --生产者负责采集数据并把数据传输到kafka的某个topic中。比如:flum、java后台服务、shell脚本、logstash–生产者是由多个进程组成的(可以有多个生产者组成)。一个生产者可以作为一个独立的进程,可以独立的分发数据–多个生产者发送的数据时可以存储到同一个topic的同一个partition的–一个生产...

2018-11-12 09:31:18 424 1

原创 kafka api实现消费者

kafka api-实现消费者本次测试依赖:<dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-streaming_2.11</artifactId> <version>...

2018-11-12 08:44:37 263

原创 kafka api-实现生产者

kafka api-实现生产者本次测试依赖:<dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-streaming_2.11</artifactId> <version>...

2018-11-12 08:43:50 264

原创 kafka常见问题

#kafka常见问题 V21、如果想消费已经被消费过的数据consumer是底层采用的是一个阻塞队列,只要一有producer生产数据,那consumer就会将数据消费。当然这里会产生一个很严重的问题,如果你重启一消费者程序,那你连一条数据都抓不到,但是log文件中明明可以看到所有数据都好好的存在。换句话说,一旦你消费过这些数据,那你就无法再次用同一个groupid消费同一组数据了。原因...

2018-11-10 15:18:54 771

原创 kafka中的几个常见问题

#kafka中的几个常见问题 V1版1,每个topic的分区中有多个segment,一个分区会被分成相同大小数据数量不等的segment,数据的生命周期就是指的是segment的生命周期2,数据的存储机制:首先是Broker接受到数据,将数据放到操作系统的缓存里,(pagecache),pagecache会尽可能多的使用空闲内存,使用sendfile技术尽可能多的减少操作和应用程序之...

2018-11-10 15:09:58 206

原创 YARN的任务提交流程简述及图解

#YARN的任务提交流程简述及图解1,Client向ResourceManager发出请求,提交程序,(ResourceManager中有Scheduler调度器和ApplicationsManager应用程序管理器2,ResourceManager向Scheduler返回一个ApplicationID作为回应3,Client向RM回应Application Submission Conte...

2018-11-10 09:27:14 2804

原创 H-JavaAPI之过滤器

文章目录过滤器流程1、构造Table对象2、构造Scan对象3、构造比较器对象4、构造过滤器对象5、将比较器对象绑定到过滤器对象6、将过滤器对象绑定到Scan对象7、将Scan绑定到Table对象8、读取Table中的信息比较器类型RegexStringComparatorBinaryComparatorBinaryPrefixComparatorSubstringComparatorNullCo...

2018-11-08 09:27:15 318

docker20.10.9

docker20.10.9

2023-10-16

车流量监控项目

包含车流量监控项目的过程解析、以及sql。还有源代码。项目中的libs目录下缺一个包spark-assembly-1.6.0-hadoop2.4.0,可自行下载

2019-05-07

大数据DMP项目

DMP项目的项目需求、介绍,计算逻辑,以及开发代码和源数据等,

2019-05-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除