自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

赵英超的博客

相互学习,共同进步,如果对你有帮助,请记得点赞支持,谢谢!

  • 博客(16)
  • 资源 (18)
  • 收藏
  • 关注

原创 ElasticSearch 优化实战

二. 查询性能(Query Perofrmance)王道是什么?routing,routing,还是 routing。我们为了提高查询速度,减少慢查询,结合自己的业务实践,使用多个集群,每个集群使用不同的 routing。比如,用户是一个routing维度。在实践中,这个routing 非常重要。我们碰到一

2017-10-28 15:17:50 1078

原创 ElasticSearch 优化总结

ElasticSearch 优化总结目录ElasticSearch 优化总结目录OSOS 参数说明OS 参数配置ESLinux Release: CentOS release 6.4ES Version: 2.xOSOS 参数说明vm.swappiness1

2017-10-28 15:08:56 830

原创 elasticsearch调优技巧

elasticsearch 性能调优所有的修改都可以在elasticsearch.yml里面修改,也可以通过api来修改。推荐用api比较灵活1.不同分片之间的数据同步是一个很大的花费,默认是1s同步,如果我们不要求实时性,我们可以执行如下:$ curl -XPUT 'http://localhost:9200/twitter/' -d '{ "

2017-10-28 09:39:45 8454

原创 NiFi流处理引擎

有特点的流处理引擎NiFi流处理不止有flink、storm、spark streaming,今天介绍一个大家不一定用得很多,但是却很有特点的东西,NiFi。前面写了flink的文章,其实流处理不止有flink、storm、spark streaming,说实话这些其实都是比较传统的流处理框架。今天介绍一个大家不一定用得很多,但是却很有特点的东西,NiFi。

2017-10-24 19:26:10 6082

原创 spark driver HA

实验环境: zookeeper-3.4.6 Spark:1.6.0 简介: 本篇博客将从以下几点组织文章: 一:Spark 构建高可用HA架构 二:动手实战构建高可用HA 三:提交程序测试HA一:Spark 构建高可用HA架构  Spark本身是Master和Slave,而这这里的 Master是指Spark资源调度和分配。负责整个集群的资源调度和分

2017-10-24 10:16:29 1278

转载 SparkStreaming Kafka基本概念

1.Storm 和 SparkStreaming区别Storm                     纯实时的流式处理,来一条数据就立即进行处理SparkStreaming微批处理,每次处理的都是一批非常小的数据Storm支持动态调整并行度(动态的资源分配),SparkStreaming(粗粒度, 比

2017-10-24 09:47:38 622

原创 最全spark基础知识

《倾情大奉送--Spark入门实战系列》 1、 Spark运行架构1.1 术语定义lApplication:Spark Application的概念和Hadoop MapReduce中的类似,指的是用户编写的Spark应用程序,包含了一个Driver 功能的代码和分布在集群中多个节点上运行的Executor代码;lDriver:Spark中的Driver即运行上述Applicati

2017-10-23 20:13:45 926

原创 spark性能优化高级篇

Spark性能调优高级篇 分类:spark平台学习(2) 目录(?)[+]前言继Spark性能调优基础篇讲解了每个Spark开发人员都必须熟知的开发调优与资源调优之后,本文作为《Spark性能优化指南》的高级篇,将深入分析数据倾斜调优与shuffle调优,以解决更加棘手的性能问题。数据倾斜调优

2017-10-23 19:33:13 460

转载 spark SQL上踩过的坑

那些年我们在spark SQL上踩过的坑1.高并发情况下的内存泄露的具体表现很遗憾,spark的设计架构并不是为了高并发请求而设计的,我们尝试在网络条件不好的集群下,进行100并发的查询,在压测3天后发现了内存泄露。a)在进行大量小SQL的压测过程中发现,有大量的activejob在spark ui上一直处于pending状态,且永远不结束,如下图所示

2017-10-21 19:58:25 1065

原创 spark-sql调优

sparksql性能调优性能优化参数 代码实例import java.util.List;import org.apache.spark.SparkConf;import org.apache.spark.api.java.JavaSparkContext;import org.apache.spark.sql.api.java.JavaSQLContext

2017-10-21 19:45:41 4086

原创 Spark Sql性能测试

Spark Sql性能测试及调优目录(?)[+]内存不足时group by操作失败。正常应该速度变慢,而不是失败,因为还有磁盘可用错误日志:Task:java.io.IOException: Filesystem closed       atorg.apache.hadoop.hdfs.DFSClient.check

2017-10-21 19:38:37 1010

原创 机器学习与深度学习资料

机器学习与深度学习资料机器学习《Brief History of Machine Learning》介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机、神经网络、决策树、SVM、Adaboost到随机森林、Deep Learning.《Deep Learning in Neural Networks: An Overview》介绍:这

2017-10-21 19:17:58 3907

原创 JVM调优实战

java application项目(非web项目)改进前:-Xms128m-Xmx128m-XX:NewSize=64m-XX:PermSize=64m-XX:+UseConcMarkSweepGC-XX:CMSInitiatingOccupancyFraction=78-XX:ThreadStackSize=128-Xloggc:logs/gc.log-Dsun.rmi.dgc

2017-10-18 19:36:15 412

原创 Spark on Yarn下JVM的OOM问题及解决方式

Spark JVM的OOM和Stack Overflow问题1、Spark on Yarn下JVM的OOM问题及解决方式 2、Spark中Driver的Stack Overflow的问题及解决方式Spark on Yarn cluster mode: 此时有可能会报OOM的错误,具体来说: 由于Client模式下一定没有出现OOM,而在Cluster模式下一定出现了

2017-10-18 17:58:34 1845

原创 Spark SQL UDF和UDAF示例

Spark SQL UDF和UDAF/** * scala代码 */package com.tom.spark.sqlimport org.apache.spark.sql.expressions.{MutableAggregationBuffer, UserDefinedAggregateFunction}import org.apache.spark.sql.types._

2017-10-18 17:46:40 2126

原创 Spark Parquet使用

Spark SQL下的Parquet使用最佳实践和代码实战 分类:spark-sql(1) 一、Spark SQL下的Parquet使用最佳实践1)过去整个业界对大数据的分析的技术栈的Pipeline一般分为以下两种方式:a)Data Source -> HDFS -> MR/H

2017-10-18 15:09:26 11828

GitkrakenCrack.zip

GitkrakenCrack.zip

2023-04-04

activiti 6.0汉化包,绝对可用

activiti 6.0汉化包,绝对可用.代码集成去除lib jar包

2018-11-29

ReceiverCleanupUtility

一、卸载Citrix Receiver两种办法 1、打开控制面板--程序和功能--卸载程序--Citrix Receive,进行卸载 2、通过官方提供的专业卸载工具进行卸载ReceiverCleanupUtility

2018-09-20

StarUMLv3.0.2 安装文件 破解补丁 集合

StarUMLv3.0.2 安装文件 破解补丁 集合 欢迎使用,支持正版!请勿商业使用!

2018-08-24

StarUML Setup 3.0.2

StarUML Setup 3.0.2 很好用哦!推荐! 破解文件见另一个地址!

2018-08-24

自动化运维工具 Ansible 详细部署

自动化运维工具Ansible详细部署

2016-07-07

SQL Delta 6.2.2.2066 crack 破解版

SQL Delta 6.2.2.2066 crack 破解版

2016-07-07

软件加密 打包 自动化安装 makeself

软件加密 打包 自动化安装 makeself

2015-12-30

bunifyDeploy

比Ansible更吊的自动化运维工具,自动化统一安装部署_自动化部署

2015-12-30

清华大学ARM培训教材.pdf

清华大学ARM培训教材.pdf 绝对有用

2013-01-09

Linux系统命令及其使用详解

Linux系统命令及其使用详解 Linux系统命令快速上升

2013-01-09

android手机wifi热点通信代码

android手机wifi热点通信代码 初学者必须的资料

2013-01-09

HTC__G11刷机教程

HTC__G11刷机教程 初学者必须文档

2013-01-09

linux-超级终端

linux-超级终端 linux开发必须工具

2013-01-09

十个外贸超实用小工具网址.

十个外贸超实用小工具网址. 希望对大家有用 很不错哦

2013-01-04

GUI中文详细手册

GUI中文详细手册是GUI开发必备资料,很详细

2011-10-30

GUI编译通过内核

GUI编译通过内核,FPGA、ARM.....开发资料,界面很好很强大

2011-10-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除