写在前面:
记得以前赖勇浩(http://blog.csdn.net/lanphaday)老师有一系列文章叫做"本周我加星",这里我借鉴他的标题,每月用一篇日志,整理这个月看的技术类的文章。每篇文章都是我精读过的,数量大概在25~30篇上下浮动,保证每篇文章的质量,并附上一两句的介绍。如果是网上有的,我会给出链接,否则我会给出详细的出处。主要关注以下几个主题:Linux、搜索引擎、架构、存储。
系列链接:
[2011年12月]本月我加星(一)http://www.cnblogs.com/liuhao/archive/2012/01/02/2310407.html
0.Mysql性能优化教程
http://wenku.baidu.com/view/aa43ecc3aa00b52acfc7ca94.html?st=1
4399架构师caoz(http://weibo.com/caoz)给出的经验之谈,非常值得细读。caoz自己给出的文档介绍如下:"1.数据库索引优化,SQL优化 2.运维优化,i/o存储优化 3.架构优化,反范式设计 在高并发情况下解决海量数据的存储与查询响应问题,针对初阶,中阶工程师进一步提升使用,高手请忽略。"了解了影响结果集和数据库操作效率的关系,了解反范式设计。
1.海量存储系列
http://qing.weibo.com/whisperxd
淘宝工程师whisper写的一系列文章,目前已发表了12篇,内容浅显,自成体系,值得追读。
2.如何预测用户query意图
http://www.searchtb.com/2011/01/how-to-predict-user-query-intent.html
淘宝搜索技术博客,介绍query分析,系统架构,前端,Query处理,搜索引擎,日志存储,统计分析,机器学习。
3.从狄仁杰的测字占卜到一淘网的Query分析
同样来自于淘宝技术博客,以狄仁杰猜字引入,但介绍不如上一篇文章全面。
4.Google Protocol Buffer 的使用和原理
http://www.ibm.com/developerworks/cn/linux/l-cn-gpb/index.html?ca=drs-
Protocol Buffers 是一种轻便高效的结构化数据存储格式,可以用于结构化数据串行化,很适合做数据存储或 RPC 数据交换格式。它可用于通讯协议、数据存储等领域的语言无关、平台无关、可扩展的序列化结构数据格式。目前提供了 C++、Java、Python 三种语言的 API。
5.服务器底层框架及 RPC
http://blog.codingnow.com/2012/01/dev_note_7.html
云风写的开发笔记第七篇。这一系列文章,同样自成体系,但内容深度更大些,场景就是网游的后台,需要更多的背景知识。比如这篇,我就读的云里雾里。
6.MySQL 数据库性能优化之索引优化
http://isky000.com/database/mysql-performance-tuning-index
来自《MySQL性能调优与架构设计 》作者简朝阳的blog,内容如题,通俗易懂。
7.铁路订票系统的简单设计
http://blog.codingnow.com/2012/01/ticket_queue.html
春运买票难年年如此,12306的糟糕表现引起各路大侠纷纷给出自己的解决方案。这篇文章是云风给出的方案,排队+现有系统对接,简单,但个人认为最靠谱。
8.铁路订票网站个人的设计浅见
http://hi.baidu.com/caoz/blog/item/f4f1d7caee09b558f21fe780.html
caoz给出的解决方案,糙快猛。
“做个简要总结,该方案所适应场景
1:查询请求频次远大于数据更新频次。
2:所有人同一时刻查询同一条件返回结果一致。
在二者条件满足的情况下,查询结果可以静态化,静态化不代表不动态更新
更新通过服务端的数据变化触发,而非通过用户请求触发。这样就可以保证静态化发布和动态化更新。”
9.林仕鼎:简单讨论火车票系统后面的架构设计
http://qing.weibo.com/2244218960/85c4105033000a3v.html
百度(移动.云)首席架构师结合12306谈论架构设计方面的普适性原理,更方法论。
10.由12306.cn谈谈网站性能技术
http://coolshell.cn/articles/6470.html/comment-page-1#comment-126671
coolshell给出的全面的介绍,各方面技术都有涉及,郑重推荐。
11.五年Skype架构师之路的感言
http://wenku.baidu.com/view/fc4670a1284ac850ad024284.html
skype架构师经验之谈。
12.CDN技术介绍
http://rdc.taobao.com/blog/cs/?p=106
taobao核心系统团队,针对CDN技术给出的介绍。
13.数据驱动的电子商务组织架构的迷局和反思
http://www.chinawebanalytics.cn/data-driven-org-thinkings/
数据部门在企业中应处于何种地位,如何解读数据。
14.理查德·斯托曼一直是对的
http://www.ruanyifeng.com/blog/2012/01/richard_stallman_was_right_all_along.html
“软件代码不仅仅是商业产品,更重要的,它是人类自由的一部分。如果我们要保卫自由,就必须支持自由软件。”
15.如何选择开源许可证
http://www.ruanyifeng.com/blog/2011/05/how_to_choose_free_software_licenses.html
一图顶千言
16.the little redis book
http://openmymind.net/redis.pdf
作者Karl 说:“I hope this helps people who are new to Redis. I also hope there's maybe one or two useful things in here for developers already familiar with it. ”
17.从层次化到竖井式
http://qing.weibo.com/2244218960/85c4105033000b4h.html
“云的到来,使得自己制造整套系统成为可能。”
18.从C++到Java,10年技术生涯的几点思考
http://blog.csdn.net/chui88/article/details/6330408
19.Amazon DynamoDB详解
http://wangyuanzju.blog.163.com/blog/static/1302920120190113613/
“数据库,最简单的莫过KV,最复杂多能的莫过传统关系数据库。现在一般认为KV太过简单,关系数据库太过复杂,怎么才是最好的中庸之道,是大家都在探索的问题。时至今日,各项技术都明了,难做的是怎么取舍。DynamoDB是Amazon基于多年经验给出的答案,其特点是类似于关系表但Schemaless的灵活数据模型、组合主键、条件更新、可选的一致性读、受限的范围扫描、全表扫描等,没有多记录原子操作。以Amazon的经验,这些取舍当然值得重视。但并非唯一,如在数据库领域更富有经验的Oracle做的NoSQL数据库则包含多记录原子操作功能。”
20.2011年最影响具力的16个开源项目
http://news.cnblogs.com/n/129379/
hbase,node.js,nginx分列1、2、3,但java项目偏多,怀疑评价的标准是否合理。
21.淘宝技术普及贴
http://www.vjianke.com/ZZB24.clip
据说出自一个taobao的实习生之笔,大牛,郑重推荐。
22.个性化时代
http://www.guwendong.com/post/2012/recsys-era-coming.html
除了博客内容,里边给出的链接也值得对“推荐系统”有兴趣的同学重点关注。