(收藏)各大型网站架构分析收集

原创 2011年01月08日 08:36:00

 

(收藏)各大型网站架构分析收集

2009-10-12 17:14 by 圣殿骑士, 148 visits, 网摘, 收藏, 编辑

原文链接:http://blog.csdn.net/lovingprince/archive/2008/11/26/3379710.aspx

 

1. PlentyOfFish 网站架构学习
http://www.dbanotes.net/arch/plentyoffish_arch.html

 

采取 Windows 技术路线的 Web 2.0 站点并不多,除了 MySpace ,另外就是这个PlentyOfFish。这个站点提供 “Online Dating”服务。一个令人津津乐道的、惊人的数据是这个只有一个人(创建人Markus Frind)的站点价值 10 亿,估计要让很多人眼热,更何况Markus Frind 每天只用两个小时打理网站–可操作性很强嘛。

2. 从LiveJournal后台发展看 大型网站系统架构以及性能优化方法
http://www.example.net.cn/archives/2006/03/olivejournaloio.html

LiveJournal是99年始于校园中的项目,几个人出于爱好做了这样一个应用,以实现以下功能:
* 博客,论坛
* 社会性网络,找到朋友
* 聚合,把朋友的文章聚合在一起

LiveJournal采用了大量的开源软件,甚至它本身也是一个开源软件。

在上线后,LiveJournal实现了非常快速的增长:
* 2004年4月份:280万注册用户。
* 2005年4月份:680万注册用户。
* 2005年8月份:790万注册用户。
* 达到了每秒钟上千次的页面请求及处理。
* 使用了大量MySQL服务器。
* 使用了大量通用组件。

3. YouTube 的架构扩展
http://www.dbanotes.net/opensource/youtube_web_arch.html

在西雅图扩展性的技术研讨会上,YouTube 的 Cuong Do 做了关于 YouTube Scalability的报告。视频内容在 Google Video 上有(地址),可惜国内用户看不到。
Kyle Cordes 对这个视频中的内容做了介绍。里面有不少技术性的内容。值得分享一下。(Kyle Cordes的介绍是本文的主要来源)

4. WikiPedia 技术架构学习分享
http://www.dbanotes.net/opensource/wikipedia_arch.html

维基百科(WikiPedia.org)位列世界十大网站,目前排名第八位。这是开放的力量。

来点直接的数据:

* 峰值每秒钟3万个 HTTP 请求
* 每秒钟 3Gbit 流量, 近乎375MB
* 350 台 PC 服务器

5. Tailrank 网站架构
http://www.dbanotes.net/review/tailrank_arch.html

每天数以千万计的 Blog 内容中,实时的热点是什么? Tailrank 这个 Web 2.0 Startup致力于回答这个问题。

专门爆料网站架构的 Todd Hoff 对 Kevin Burton 进行了采访。于是我们能了解一下 Tailrank架构的一些信息。每小时索引 2400 万的 Blog 与 Feed,内容处理能力为 160-200Mbps,IO写入大约在10-15MBps。每个月要处理 52T 之多的原始数据。Tailrank所用的爬虫现在已经成为一个独立产品:spinn3r。

6. LinkedIn 架构笔记
http://www.dbanotes.net/arch/linkedin.html

LinkedIn 雇员有 180 个,在 Web 2.0 公司中算是比较多的,不过人家自从 2006 年就盈利了,这在 Web 2.0站点中可算少的。用户超过 1600 万,现在每月新增 100 万,50% 会员来自海外(中国用户不少,也包括我).

7. Yahoo!社区架构
http://www.dbanotes.net/arch/yahoo_arch.html

旧金山举行的 QCon会议带给我们很多新鲜的信息。虽然没机会参加,但是看看各个网站”晒架构”也是个比较过瘾的事情。请参观并收藏这个页面:Architecturesyou’ve always wondered about。

8. Craigslist 的数据库架构
http://www.dbanotes.net/database/craigslist_database_arch.html

Craigslist 绝对是互联网的一个传奇公司。根据以前的一则报道:

每月超过 1000 万人使用该站服务,月浏览量超过 30 亿次,(Craigslist每月新增的帖子近 10亿条??)网站的网页数量在以每年近百倍的速度增长。Craigslist 至今却只有 18 名员工(现在可能会多一些了)。

9. Fotolog.com 的技术信息拾零
http://www.dbanotes.net/review/fotolog_arch.html

尽管是世界上最大的图片服务网站, Fotolog.com 在国内的名气并不是很响亮, 每当提到图片服务, 很多人第一个会想起Flickr. 但实际上 Fotolog 也的确是很猛的, Alexa 上的排名一直在 Flickr 前面, 目前注册用户超过1100 万. 而前不久也卖了一个好价钱, 9000 万美金. 算下来的话, 1 个注册用户大约 9 美金. Yupoo的刘平阳可以偷着算算自己的网站如果卖给老外是怎样一个价格了.

10. Digg 网站架构
http://www.dbanotes.net/arch/digg_arch_cache_and_shard.html

Digg 工程师采用 LAMP (Linux, Apache, MySQL and PHP) 模式。这个 Alexa 排名在 100左右的、自我估价 1.5 亿美金的站点目前有超过 100 台的 PC 服务器(足够少了),可以粗略分成三个部分:数据库服务器,Web服务器,搜索服务器。

11. Amazon 的 Dynamo 架构
http://www.dbanotes.net/techmemo/amazon_dynamo.html

我在 DBAnotes.net 上记录过不少比较大的网站架构分析(eg: eBay [1], eBay [2]) ,Amazon一直找不到太多的资料。国庆期间读到了一篇关于 Amazon Dynamo 的论文,非常精彩。Amazon Dynamo这个高可用、可扩展存储体系支撑了Amazon 不少核心服务.

12. 财帮子(caibangzi.com)网站架构
http://www.dbanotes.net/arch/caibangzi_web_arch.html

财帮子(caibangzi.com) 定位在”基金理财社区”。是国内访问量最大的基于 Ruby on rails 的 startup项目。“理财”这个词据说是光大银行发明的,且不去管,不可否认的是,目前国内”理财”是个很有潜力的切入点。财帮子网站潜在用户群还是很大的。

13. 了解一下 Technorati 的后台数据库架构
http://www.dbanotes.net/web/technorati_db_arch.html

目前处理着大约 10Tb 核心数据, 分布在大约 20 台机器上.通过复制, 多增加了 100Tb 数据, 分布在 200 台机器上.每天增长的数据 1TB. 通过 SOA 的运用, 物理与逻辑的访问相隔离, 似乎消除了数据库的瓶颈. 值得一提的是,该扩展过程始终是利用普通的硬件与开源软件来完成的. 毕竟 , Web 2.0 站点都不是烧钱的主.从数据量来看,这绝对是一个相对比较大的 Web 2.0 应用.

14. 说说大型高并发高负载网站的系统架构
http://www.toplee.com/blog/?p=71

我在CERNET做过拨号接入平台的搭建,而后在Yahoo&3721从事过搜索引擎前端开发,又在MOP处理过大型社区猫扑大杂烩的架构升级等工作,同时自己接触和开发过不少大中型网站的模块,因此在大型网站应对高负载和并发的解决方案上有一些积累和经验,可以和大家一起探讨一下。

15. 大型高负载网站架构 的感想
http://atman.memoab.com/articles/194

各大型网站架构分析收集

1. PlentyOfFish 网站架构学习 http://www.dbanotes.net/arch/plentyoffish_arch.html 采取 Windows 技术路线的 Web ...
  • IT_YUAN
  • IT_YUAN
  • 2014年05月09日 17:03
  • 591

各大型网站架构分析收集

1. PlentyOfFish 网站架构学习http://www.dbanotes.net/arch/plentyoffish_arch.html采取 Windows 技术路线的 Web 2.0 站点...
  • changemyself
  • changemyself
  • 2008年11月28日 16:58
  • 890

可兼容所有浏览器的“收藏本站”、“设为首页”js代码

设为首页 和 收藏本站js代码 兼容IE,chrome,ff,360等   将以下代码放到首页 或者新建js文件 //设为首页 www.ecmoban.com func...
  • ao_xiaoqiang
  • ao_xiaoqiang
  • 2014年09月05日 13:54
  • 14615

PHP大型网站的架构实例分析

Poppen.de是德国的一个社交网站,相对Facebook、Flickr来说是一个很小的网站,但它有一个很好的架构,融合了很多技术,如 Nigix、MySql、CouchDB、Erlang、Memc...
  • nuli888
  • nuli888
  • 2016年07月09日 16:07
  • 3545

大型网站架构体系的演变(上)

互联网上有很多关于网站架构的各种分享,有些主要是从运维和基础架构的角度去分析的(堆机器,做集群),太关注技术细节实现,普通的开发人员基本看不太懂。 本文上篇将主要介绍大型网站基础架构的扩展,下篇则重点...
  • dinglang_2009
  • dinglang_2009
  • 2015年06月07日 11:28
  • 13222

精品js Firefox 加入收藏夹功能代码 兼容Firefox 和 IE等各种浏览器

精品js Firefox 加入收藏夹功能代码 兼容Firefox 和 IE等各种浏览器
  • xst686
  • xst686
  • 2013年09月07日 21:24
  • 2983

优惠券收集问题

今天无意间看到了一道数学题,据说google面试出过这道题. (只看长度)1米长的路面,每次只下1滴雨,覆盖0.01米的路面,落点均匀分布,问路面被完全覆盖所需要的雨滴数目的数学期望。 这道题和“...
  • xiaoyuaifuxiao
  • xiaoyuaifuxiao
  • 2017年03月16日 16:01
  • 952

Android开发人员不得不收集的工具类

Android开发人员不得不收集的工具类为方便查找,已进行大致归类,其目录如下所示: App相关→AppUtils.java 获取安装App(支持6.0)的意图 getInstal...
  • sinat_33061081
  • sinat_33061081
  • 2016年09月23日 17:23
  • 3335

方片收集——高效的你必看

前言 今天给大家介绍一款实用网页小插件——方片收集。 身处信息时代,每天被无数的信息所包围,如何高效的收集各种对我们有用的信息变得尤为重要,信息不光要涉及到合理的分类,而且快速找到你收集的信息也是...
  • cd18333612683
  • cd18333612683
  • 2016年12月13日 16:26
  • 1207

android中如何取得用户手机的常用联系人(即收藏夹的联系人)

代码: /** * 获得收藏夹的联系人 */ private void getKeepedContacts(){ Cursor cur = getContentResolver()....
  • qiaoning13256
  • qiaoning13256
  • 2011年10月19日 23:36
  • 5064
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:(收藏)各大型网站架构分析收集
举报原因:
原因补充:

(最多只允许输入30个字)