2011年12月_fourinone

12月 09月

淘宝Fourinone和Hadoop的完整对比

fourinone-1.11.09hadoop-0.21.0体积82K71M依赖关系就一个jar,没有依赖约12项jar包依赖配置就一个配置文件较多配置文件和复杂属性集群搭建简单，每台机器放一个jar和配置文件...

2011-12-07 11:50:28 85

用淘宝Fourinone实现Hadoop经典实例wordcount

很多人是通过wordcount入门分布式并行计算, 该demo演示了Hadoop的经典实例wordcount的实现输入数据：n个数据文件，每个1g大小，为了方面统计，每个文件的数据由“aaa bbb ... ccc”(由空格分割的1k单词组)不断复制组成。输出数据：输出这n*1g个数据文件中的每个单词总数fourinone简单实现思路，假设有n台计算机，将这n个1g数据文件...

2011-12-07 11:46:35 109

<七>基于淘宝Fourinone实现MQ demo

FourInOne也可以当成简单的mq来使用，该demo演示了队列和主题订阅两种模式的实现一、队列将domain视为mq队列，每个node为一个队列消息，检查domain的变化来获取队列消息。 Sender：是一个队列发送者，他发送消息的实现是在queue上创建一个匿名节点来存放消息 pl.create(queue, (Serializable)obj);Receiv...

2011-12-07 11:36:34 97

原创 <六>基于淘宝Fourinone实现分布式缓存demo

利用fourinone可以轻松实现分布式缓存功能：1、中小应用的缓存实现：直接启动一个parkserver，分别在两个java进程中使用ParkLocal的create和get方法即可实现缓存的读写操作。2、如果是大型网站的缓存，单台parkserver的压力不能承受，需要建立多台CacheServer，并且使用CacheFacade进行负载均衡，CacheFacade会根据key...

2011-12-07 11:34:31 155

<五>基于淘宝Fourinone实现分布式锁demo

LockDemo是利用fourinone进行分布式锁的实现：可以启动多个LockDemo实例，每个实例在fourinone上建立一个自己的node, node的domain为lock， node的值为node 然后再轮循判断domain lock的第一个元素是否是自己的node，如果是，就执行，这里模拟线程执行8秒，执行完将自己的node删除，代表释放锁；如果不是，就继续等待。 ...

2011-12-07 11:19:34 144

原创淘宝Fourinone和Hadoop的完整对比

fourinone-1.11.09hadoop-0.21.0体积82K71M依赖关系就一个jar,没有依赖约12项jar包依赖配置就一个配置文件较多配置文件和复杂属性集群搭建简单，每台机器放一个jar和配置文件复

2011-12-05 15:23:11 1050

原创用淘宝Fourinone实现Hadoop经典实例wordcount

2011-12-05 15:08:35 856

原创 <七>基于淘宝Fourinone实现MQ指南和demo

FourInOne也可以当成简单的mq来使用，该demo演示了队列和主题订阅两种模式的实现一、队列将domain视为mq队列，每个node为一个队列消息，检查domain的变化来获取队列消息。Sender：是一个队列发送者，他发送消息的实现是在queue上创建一个匿名节点来存放消息pl.create(queue, (Serializable)obj);Receiver：是一个队

2011-12-05 13:51:17 600

原创 <六>基于淘宝Fourinone实现分布式缓存指南和demo

2011-12-05 13:49:38 550

原创 <五>基于淘宝Fourinone实现分布式锁指南和demo

LockDemo是利用fourinone进行分布式锁的实现：可以启动多个LockDemo实例，每个实例在fourinone上建立一个自己的node, node的domain为lock， node的值为node然后再轮循判断domain lock的第一个元素是否是自己的node，如果是，就执行，这里模拟线程执行8秒，执行完将自己的node删除，代表释放锁；如果不是，就继续等待。运行步

2011-12-05 13:46:29 647

原创 <四>基于淘宝Fourinone实现集群管理demo

对于像淘宝这样上万台服务器集群环境的大型互联网应用, 通常我们面临这样一种需求:我们需要一个集群管理者管理集群里的服务器，同一个集群中任何一台服务器宕机,其他服务器都能感知. 如果是集群管理者宕机，集群中所有的服务器不能受任何影响，能实时切换到备份管理者上被提供服务。这个demo演示了如何利用fourinone在简单几行代码下去实现上述功能GroupManager：是一个集

2011-12-05 13:44:41 614

原创 <三>基于淘宝Fourinone实现统一配置管理指南和demo

在分布式多台机器环境下,维持统一的配置信息是最常见的需求, 当配置信息改变时,所有的机器能实时获取并更新。fourinone通过park进行配置信息管理，park提供创建和修改信息的方法，并支持轮循和事件响应两种方式获取变化的对象，两种方式的效果一样。SetConfig：在parkserver上建立一个“domain=浙江、node=杭州、value=西湖”的配置信息，并且在10秒后把“西

2011-12-05 13:41:00 1231

大数据机遇和挑战

本ppt完整介绍了大数据的背景、机遇和挑战,并且相关的落地技术和业界状况,为大数据的研究提供全面的参考

2012-10-08

fourinone架构原理

fourinone实现了对多台计算机的cpt,内存，硬盘资源的统一利用该ppt包括了fourinon背景，架构，原理等丰富图文说明. 开发包和demo源码下载地址: http://www.skycn.com/soft/68321.html

2012-09-19

Fourinone分布式计算框架性能、压力、容灾测试报告

Fourinone在去年11月在淘宝内部通过了压测，上亿排序和wordcount等经典指标均优于hadoop，这是一份长达10多页的详细测试报告

2012-02-27

FourInOne（中文名字“四不像”）是一个四合一分布式计算框架，在写这个框架之前，我也看了老外写的其他开源框架，也对分布式计算进行了长时间的思考，当我们把复杂的hadoop当作一门学科学习时，似乎忘记了我们想解决问题的初衷：我们仅仅是想写个程序把几台甚至更多的机器一起用起来计算，把更多的cpu和内存利用上，来解决我们数量大和计算复杂的问题，当然这个过程中要考虑到分布式的协同和故障处理。如果仅仅是为了实现这个简单的初衷，为什么一切会那么复杂，我觉的自己可以写一个更简单的东西，它不需要过度设计，只需要看上去更酷一点，更小巧一点，功能更强一点。于是我将自己对分布式的理解融入到这个框架中，考虑到底层实现技术的相似性，我将Hadoop,Zookeeper,MQ,分布式缓存四大主要的分布式计算功能合为一个框架内，对复杂的分布式计算应用进行了大量简化和归纳。首先，对分布式协同方面，它实现了Zookeeper所有的功能，并且做了很多改进，包括简化Zookeeper的树型结构，用domain/node两层结构取代，简化Watch回调多线程等待编程模型，用更直观的容易保证业务逻辑完整性的内容变化事件以及状态轮循取代，Zookeeper只能存储信息不大于1M的内容，FourInOne超过1M的内容会以内存隐射文件存储，增强了它的存储功能，简化了Zookeeper的ACL权限功能，用更为程序员熟悉rw风格取代，简化了Zookeeper的临时节点和序列节点等类型，取代为在创建节点时是否指定保持心跳，心跳断掉时节点会自动删除。FourInOne是高可用的，没有单点问题，可以有任意多个复本，它的复制不是定时而是基于内容变更复制，有更高的性能，FourInOne实现了领导者选举算法（但不是Paxos），在领导者服务器宕机情况下，会自动不延时的将请求切换到备份服务器上，选举出新的领导者进行服务，这个过程中，心跳节点仍然能保持健壮的稳定性，迅速跟新的领导者保持心跳连接。基于FourInOne可以轻松实现分布式配置信息，集群管理，故障节点检测，分布式锁，以及淘宝configserver等等协同功能。其次, FourInOne可以提供完整的分布式缓存功能。如果对一个中小型的互联网或者企业应用，仅仅利用domain/node进行k/v的存储即可，因为domain/node都是内存操作而且读写锁分离，同时拥有复制备份，完全满足缓存的高性能与可靠性。对于大型互联网应用，高峰访问量上百万的并发读写吞吐量，会超出单台服务器的承受力，FourInOne提供了fa?ade的解决方案去解决大集群的分布式缓存，利用硬件负载均衡路由到一组fa?ade服务器上，fa?ade可以自动为缓存内容生成key，并根据key准确找到散落在背后的缓存集群的具体哪台服务器，当缓存服务器的容量到达限制时，可以自由扩容，不需要成倍扩容，因为fa?ade的算法会登记服务器扩容时间版本，并将key智能的跟这个时间匹配，这样在扩容后还能准确找到之前分配到的服务器。另外，基于FourInOne可以轻松实现web应用的session功能，只需要将生成的key写入客户端cookie即可。 FourInOne对于分布式大数据量并行计算的解决方案不同于复杂的hadoop，它不像hadoop的中间计算结果依赖于hdfs，它使用不同于map/reduce的全新设计模式解决问题。FourInOne有“包工头”，“农民工”，“手工仓库”的几个核心概念。“农民工”为一个计算节点，可以部署在多个机器，它由开发者自由实现，计算时，“农民工”到“手工仓库”获取输入资源，再将计算结果放回“手工仓库”返回给“包工头”。“包工头”负责承包一个复杂项目的一部分，可以理解为一个分配任务和调度程序，它由开发者自己实现，开发者可以自由控制调度过程，比如按照“农民工”的数量将源数据切分成多少份，然后远程分配给“农民工”节点进行计算处理，它处理完的中间结果数据不限制保存在hdfs里，而可以自由控制保存在分布式缓存、数据库、分布式文件里。如果需要结果数据的合并，可以新建立一个“包工头”的任务分配进行完成。多个“包工头”之间进行责任链式处理。总的来说，是将大数据的复杂分布式计算，设计为一个链式的多“包工头”环节去处理，每个环节包括利用多台“农民工”机器进行并行计算，无论是拆分计算任务还是合并结果，都可以设计为一个单独的“包工头”环节。这样做的好处是，开发者有更大能力去深入控制并行计算的过程，去保持使用并行计算实现业务逻辑的完整性，而且对各种不同类型的并行计算场景也能灵活处理，不会因为某些特殊场景被map/reduce的框架限制住思维，并且链式的每个环节也方便进行监控过程。 FourInOne也可以当成简单的mq来使用，将domain视为mq队

2011-08-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人