自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

转载 AWS的Https请求和负载均衡器,以及本地web开发环境搭建

需要在AWS上发送Https请求,从AWS官网看了看资料,发现必须还要搭建AWS的负载均衡器。不太明白原因。然后查了查Https的资料,发现有介绍通过搭建Negix结合Https使用的。 先放官网文档:与 AWS Certificate Manager 集成的服务 https://docs...

2019-09-04 18:34:00 783

转载 Spark在AWS集群上的优化

业务场景:从S3中读取大量小的Avro文件,进行简单处理,转换成parquet文件。问题点:从S3读取文件,其实是一个文件一个请求发送到S3。并行度低。(当然S3也有并行设置,但是Spark集群每次处理的文件数量是CPU数)。优化:建立Spark集群时,买较多的CPU数,和较少的内存数。...

2019-09-02 17:40:00 375

转载 Azure和AWS的spark默认模式

Azure平台的spark默认是cluster模式。 AWS平台的spark默认是client模式。如果要改为cluster模式。方法1:建立集群的时候就修改为cluster。 方法2:加入参数"spark.submit.deployMode" : "cluster" 此外,SparkSQ...

2019-08-29 11:32:00 221

转载 多线程清空下,尽量不要用静态变量和属性。

多线程场景下,静态变量极有可能变成共享的变量。从数据库的多个表中读取数据,定义了一个静态的id变量,结果共享了。不同表跳跃读取数据了。 转载于:https://my.oschina.ne...

2019-07-23 09:44:00 239

转载 mysql数据库的copy

select insert 组合语句使用SELECT INTO 和 INSERT INTO SELECT 表复制语句了。  1.INSERT INTO SELECT语句  语句形式为:Insert into Table2(field1,field2,...) select value1,...

2019-06-20 15:15:00 553

转载 Linux下的查看内存

1、top 可以查看很多内容2、grep MemTotal /proc/meminfo # 查看内存总量grep MemFree /proc/meminfo # 查看空闲内存量https://blog.csdn.net/zhangliao613/article/details/7902...

2019-06-20 15:14:00 90

转载 mysql的一些操作

1、show processlist;显示哪些线程正在运行https://www.cnblogs.com/wayne173/p/8079503.html(转载链接)2、show variables like '%max_connections%';查看最大连接数3、show globa...

2019-06-19 11:02:00 76

转载 数据太大,一个map装不下

java.lang.OutOfMemoryError。这是一个继承VirtualMachineError类的Error。而VirtualMachineError又继承了Error。Error又继承Throwable。归根结底,OutOfMemoryError是一个Error,并且Error中注...

2019-06-19 10:51:00 359

转载 联合索引

MySQL的复合索引遵循了最左前缀原则,当建立索引(index_A,index_B,index_C)时:使用索引有效的字段为:'index_A’,'index_A,index_C’,'index_A,index_B’,'index_A,index_B,index_C’;使用索引失效的字段为...

2019-05-28 16:00:00 65

转载 大数据量插入Mysql的爬坑经历

性能测试阶段,预先插入一批数据到Mysql中。并分为三个阶段。第一阶段:向Mysql的三张表里,插入有关联关系的18万+18 * 3万+18 * 4万的数据。第二阶段:插入第一阶段数据量5倍的数据,即90万为基数第三阶段;插入第一阶段数据量10倍的数据即180万为基数方法1:本地JDB...

2019-05-22 17:27:00 623

转载 大数据核心知识

#Spark和Hadoop的区别#Spark任务提交过程。Hadoop任务提交过程。#Zookeeper是什么。以及在hadoop中的作用。Kafka和HBase中的作用#JS的作用:精简代码#关系型和非关系型数据库的区别#Hive存储的是什么。#数据倾斜#Spark处理过程?s...

2019-05-21 15:21:00 106

转载 技术栈一览

#数据结构和算法HashMap#SpringMVC:各种注解#SpringBoot:各种注解#SpringCloud:各种组件此图转载,图片来源@王璐-LouiseNetflix是一个大的模块,包含几个核心项目服务发现(Eureka)客服端负载均衡断路器(Hystrix)...

2019-05-20 14:43:00 396

转载 Spark的性能优化之路

spark的parallelize()方法,可以指定分区数量。在coding阶段,对此没有引起重视,只是随意填了一个很大的数,认为分区当然是越多越好。但是到了性能测试阶段,发现并不是。1.分区数太多意味着任务数太多,每次调度任务也是很耗时的,所以分区数太多会导致总体耗时增多。2.分区数太少...

2019-05-19 19:56:00 86

转载 JAVA的动态代理和CGLIB代理

2019-05-15 16:33:38.981 ERROR 7724 --- [ restartedMain] o.s.b.d.LoggingFailureAnalysisReporter :APPLICATION FAILED TO STARTDescription:The ...

2019-05-15 16:47:00 105

转载 明明是Math.ceil(),却变小了。

两个整数相除,先保留小数。直接/,会丢失精度。Math.ceil((float)a / b); 转载于:https://my.oschina.net/u/3957231/blog/304...

2019-04-22 11:54:00 144

转载 工作踩坑日志:迷茫的gradle找代理

开发踩坑日志:到了和协作公司联调测试的阶段了。带着电脑去了兄弟公司。连上别人公司的WiFi后,用eclipse无法导入自己的gradle项目。一直报错,gradle无法下载需要的jar包。甚至还有org.springboot-gradle-plugins无法下载的log。用了一天的时间排查。...

2019-04-20 13:45:00 88

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除