海量数据处理
下木
关注分布式计算,操作系统以及计算机体系结构. 微博:http://weibo.com/u/2120698533
展开
-
大师文章(updating)
The C10K Problem : http://www.kegel.com/c10k.htmlBook for those who are using rather than writing a web server : Building Scalable Web Sites: Building, Scaling, and Optimizing the Next Generation原创 2013-02-19 09:17:55 · 680 阅读 · 0 评论 -
C10K Problem
reference: WikipediaC10K来自 Concurrent Ten Thousand Connections.C10K问题指的是:如何优化套接字服务器以使之能够同时处理大量的客户请求。优化套接字服务器需要考虑的因素有操作系统本身的限制以及应用软件本身的限制。解决C10K问题的服务器有:nginx:基于异步事件驱动模型而不是线程来处理用户请求(客户:WordPre原创 2013-02-19 09:47:34 · 1179 阅读 · 0 评论 -
大数据时代的机器学习
张长水:大数据时代的机器学习 VS 传统机器学习从机器学习角度看,“大数据”指的是数据量大,数据本身不够精确,数据混杂,数据自然产生。机器学习对大数据的处理的两个挑战:数据量大导致计算困难分布在不同服务器上的数据存在一定联系,这些数据基本上不满足“独立同分布”假设,传统的模型和算法很难适应。大数据时代给机器学习带来新的机遇:在某些应用条件下,高维空间中的局部数据变得稠密。这个现象可以为分类器的设计提供更丰富的信息。甚至使分类器在性能上接近理论极限性能。大数据使样本空间原本“空旷”的区域出现样本,原创 2014-07-24 16:04:01 · 3148 阅读 · 0 评论 -
Scale Up和Scale Out的区别
Scale Out是指Application可以在水平方向上扩展。一般对数据中心的应用而言,Scale out指的是应用原创 2014-08-04 21:05:34 · 14706 阅读 · 0 评论