- 博客(8)
- 收藏
- 关注
原创 搜索引擎入门 -- 心脏
抛开"评分"(Sore)的那一部分不算,从本质上讲搜索引擎就是一全文检索系统。全文检索的核心就是如果快速的找到要找的内容,所以,如何组织数据的存储就是关键所以。说了那么一长串话的意思就是,index是搜索引擎的核心。这部分将决定处理查询的速度有多快,要是这么部分慢了,那你查出来的结果再精确也是白搭。Lucene就是一个index builder,并且也只是一个index builder。
2010-08-31 17:51:00 627 1
原创 搜索引擎入门 -- 实战准备
光说不练是假把式,光练不说是傻把式,能说会练才是好把式。实践是检验真理的唯一标准,我们一起来玩搜索引擎吧。我们今天处在一个很好的时代,有很多无私的人在从事着一种叫做“开源工程”(Open Source)的伟大事业。这其中有一个组织,它叫作"The Apache Software Foundation",中文叫"阿帕奇软件基金会"(http://www.apache.org)。"阿帕奇软件基金会"最早只有一个项目,Apache HTTP Server,这件大杀器几乎一统互联网的HTTP Server江山。
2010-08-31 16:13:00 402
原创 搜索引擎入门 -- 分类与组成
最近对搜索引擎有了兴趣,这里把自己学习的过程记录一下。喜欢转载,但请注明出处和作者(南海十三郎)。 分类:按规模分有internet(web)搜索引擎,企业级搜索引擎和个人桌面搜索引擎;按内容分有文字搜索引擎,图像/声频/视频等基于内容的搜索引擎。Web Search Engine是大家接触最多的Search Engine,Google百度就是这类了。个人桌面级的搜索引擎也有很多人在用,最常见的就是Google Desktop Search,(如果大家有好的推荐我一下)。普通用户最少接触到的就是企业级
2010-08-27 21:54:00 1110
原创 项目经理和程序员分级
低级项目经理=开发工程师+监督者+救火队员普通项目经理=开发工程师+目标制订者+目标监控者高级的项目经理=资源申请者+目标制定+冲突解决+目标监控+领导激励+......, 五流程序员比技术和工具四流程序员比整合和管理三流程序员比创意和设计二流程序员比沟通和性格一流程序员比态度和方法超级程序员比思想和素质
2007-02-24 13:42:00 889
原创 书单
C《Writing Clean Code》《高量C/C++编程指南》《Code Complete 2》C++《C++ Primer》《The C++ Programming Language》《Effective C++》《More Effective C++》 设计《Design Patterns》《UML Reference》《UML User Guider》 葵花宝典:《The Ar
2007-02-24 13:40:00 735
原创 关于编写高可靠性的软件(系统)的一些思考
关于编写高可靠性的软件(系统)的一些思考及今年决定要改善的地方。 1. 源代码与源文件 1) 总的原则是结构清晰,易于理解和查找。不管是源代码的变量,函数,模块,还是文件,目录,都应该是经过精心组织的。因为很难说怎样的目录结构和代码是最好的,所以精心组织代码和文件的结构以适应不同的应用才是上策。怎么写好的代码已经有好多书在介绍了,例如《Write Clean Code》,《C
2007-02-16 15:41:00 1205
原创 由今天没赶上厂车想开去
今天差了一两分钟,没有赶上公司的厂车,只好坐公交车。坐在公交车上,我就想到我们的Schedule的问题,我们总是强调要预估准确的Schedule。可是每天到晚上5:30分(我们5点钟下班),公司的办公区域还有有那么人在电脑前忙着。也就是说到了5:30分还在公司忙工作的人,那他/她这一天的Scheueule就没有达成。也就是说我们每天都有N多的人在Delay。那我们怎么能够保证我们1周,1月之后的S
2007-02-16 14:52:00 1045
原创 突然觉得我要写自己的Blog
之前也有写过一些,主要是在MSN上,并且设成只能是好友可见的。在CSDN上只有一篇参加9.18游行写的感想。现在决定,要经常写了。 我会把MSN上的都搬过来,把这里作为我的基本。MSN上只放练习英语的地方。套句周星驰的话“我是一个程序员”。
2007-02-16 14:46:00 585
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人