http://www.infoq.com/cn/interviews/MySpace-Architecture-Dan-Farino-cn
科学也许就是这样,现有问题的解决的同时,总是有新的问题伴生。
Dan有关My Space的谈话,让我想到,面对一个有1000量级机器构成的分布式计算集群,怎样(批量的)控制远程程序,怎样做软件下载和更新,怎样调试和监控,在问题发生时怎样迅速定位,可能成为一个新的问题。
我目前所能想到的是,分布式计算也需要一个类似EMS的东西,或许集成式的不好,可以做成一个工具集。