自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 问题记录: kafka producer.send(record) topic可以创建, 确无法从kafka-console-consumer中查看到此topic上的内容

Producer.send (record) 方法, topic可创建, 但不能发送消息到这个topic通过kafka-console-consumer.sh无法查看到

2017-08-16 10:12:33 3857 1

原创 TODO

Dump文件是进程的内存镜像。可以把程序的执行状态通过调试器保存到dump文件中。oracle dump文件: ibm optim: 归档工具 IBM® InfoSphere® Optim™ Archive (previously Optim Data Growth) is a scalable solution that can help organizations manage and su

2017-05-05 13:41:04 269

原创 Kettle7 ( Pentaho Data Integration )源码分析 每个step都有一个线程负责运行

Kettle 7 要求Java环境是Java 8 Kettle中的Transformation中包含多个step组件, 当运行transformation时, 这些组件并不是串行初始化的(数据!是在这些step间流式传递的). Step的运行是为了处理数据. 所以数据的流式传递和step的非串行启动运行是不冲突的.类Trans.java中的方法prepareExecution代码可论证上面的观点.

2017-03-16 15:31:03 2666 2

原创 kafka分布式消息中间件

Apache Kafka是一个分布式流式平台. 1. 可以发布/订阅 (publish/subscribe) records流. 2. 可以以fault-tolerance方式存储records流. 3. 可以实时处理records流. (streams of records)实用场景: 1. 在不同系统或应用间搭建实时流数据管道. 2. 搭建实时的流式应用来传输或对数据流进行响应.kaf

2017-03-14 13:26:47 419

原创 排序/查找算法Java

插入排序:适用于部分数据已经是有序的情况.有点:1. 实现简单2. 数据量较小时效率高void Insertion(intA[], int n){ int i,j,v; for(i=2; i<=n-1; i++){ v = A[i]; j = i; while(A[] > v && j>= 1){ A[

2017-03-02 12:00:22 176

原创 Hadoop作业提交源码分析

public static void main(String[] args) throws Exception { Configuration conf = new Configuration(); Job job = Job.getInstance(conf, "word count"); job.setJarByClass(WordCount.class); jo

2017-02-28 00:30:10 542

原创 Hadoop Yarn工作原理

YARN的基础功能有: 资源的管理, 作业的调度、监控等. ResourceManager和NodeManager形成了Hadoop的数据计算框架.ResourceManager: 负责系统资源在应用间的分配. ResourceManager有两个主要的组件: Scheduler和ApplicationManager. Scheduler只纯碎地负责给运行的应用分配资源, 不会执行失败任务的重启.

2017-02-27 21:08:59 847

原创 Redis主从同步 和 持久化 Pipeline 原理

redis主从复制: 1. 同一个master可以有多个slaves 2. slave可以接受其它slaves的连接和同步请求, 这样会有效地分载master的同步压力. 3. master以非阻塞方式为其slave提供同步服务. 所以在master - slave 同步期间, 客户端仍然可以提交查询,修改的请求. 4. slave server也是以非阻塞方式完成数据同步的. 在同步期间,

2017-02-27 13:37:36 674

原创 Redis3集群 结构

Redis集群: 1. redis主从结构, 多个master节点共享集群的hash slot(哈希槽 16383个,分片). 2. 主从数据的异步备份. (不能保证数据的强一致性) 3. 需要两个TCP port: 一个是客户端的连接端口(6379), 另一个端口用于节点间的数据交换和信息通信(一般是在客户端端口上再加上10000: 例如16379) 4. 集群是高可用的, 高效的, 可线性扩

2017-02-25 18:17:40 415 1

原创 hadoop作业提交源码分析

作业提交源码

2017-02-24 18:08:31 279

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除