大部分文章似乎有点老了,不知道现在FB、Tumblr、Pinterest、Twitter这些网站的架构是什么样子的了。
1、clustering vs sharding?自动/手动(需要去除join,添加cache,NoSQL似乎不如MySQL成熟?但HBase/Cassandra似乎又还可以)
2、技术为业务服务,架构为应用服务,so创新在于发现真正的有价值的问题(需求)
3、应用特定的数据库?物化“数据项”,无锁事务,append-only存储;为大规模scale设计:普通FS -> ceph/...(分布式对象数据库)
4、LB:缩短用户与“内容”之间的路径
5、howto protect data?howto USE them?
6、User table(存储用户信息的表)is not sharded.
7、shard with 大容量规划(means ‘hash big’)<-- add timestamp to hash key?
8、Mapping(分片/存储)& reverse-mapping(query)
9、cache:memcache/redis(支持的数据结构更丰富点)——不知道现在memcached功能是否完善了?
10、Scripting:sharding过滤器方案,迁移数据(not so good)
11、Pyres:Python over redis?(Res