很多应用譬如监控、即时通信、即时报价系统都需要将后台发生的变化实时传送到客户端而无须客户端不停地刷新、发送请求。本文首先介绍、比较了常用的“服务器推”方案,着重介绍了 Comet - 使用 HTTP 长连接、无须浏览器安装插件的两种“服务器推”方案:基于 AJAX 的长轮询方式;基于 iframe 及 htmlfile 的流方式。最后分析了开发 Comet 应用需要注意的一些问题,以及如何借助开源的 Comet 框架-pushlet 构建自己的“服务器推”应用。
阅读全文>
发表于 @ 2008年03月03日 10:03:00|评论(loading...)|编辑
162cm同学的全文检索引擎Hyper Estraier 学习笔记阅读全文>
发表于 @ 2008年01月25日 16:52:00|评论(loading...)|编辑
最近觉得路由器好玩,所以上网search了这篇文章,对照者看,挺有意思的,长知识哇。阅读全文>
发表于 @ 2007年12月29日 22:38:00|评论(loading...)|编辑
Sphinx 是一个专门用于快速搜索文本的免费的开源搜索引擎,本文就是使用 Sphinx 索引内容、快速查找文本并提供有用的搜索结果,能够支持中小型网站构建内部的站内搜索功能,本文就是介绍Sphinx+PHP的一个介绍文章,如果想构建自己的站点搜索引擎,但是又不想使用Lucene之类的,那么可以认真看看本文。阅读全文>
发表于 @ 2007年09月14日 16:27:00|评论(loading...)|编辑
本文描述了使用PHP数组、APC、文件、Memcache、Mysql query cache等等缓存方式的性能比较结果,值得在考虑缓存的时候采取何种方式的人看。阅读全文>
发表于 @ 2007年09月14日 13:52:00|评论(loading...)|编辑
曾就职与中搜、华友世纪、卓望等公司的屈波(兰州大学)做的一个关于搜索引擎技术介绍的ppt,我觉得做的挺不错的,我辛辛苦苦的把ppt转成gif图片上传上来,感觉能够极好的普及搜索引擎的技术原理,希望有人喜欢,不枉费我辛苦上传图片亚。阅读全文>
发表于 @ 2007年09月12日 21:14:00|评论(loading...)|编辑
Hadoop 是大名鼎鼎的 Lucene 旗下的子项目,它原先是 Nutch 项目的组成部分,于2006年初从 Nutch 中分离出来成为一个独立的项目。Hadoop 其实并非一个单纯用于存储的分布式文件系统,而是一个被设计用来在由普通硬件设备组成的大型集群上执行分布式应用的框架(framework)。Hadoop 包含两个部分:一个分布式文件系统 HDFS (Hadoop Distributed File System),和一个 MapReduce 实现。因此,Hadoop 的目标是为开发分布式应用提供一个框架,而不是像 OpenAFS, Coda 那样为存储提供一个分布式文件系统。搜索引擎就是一种典型的分布式程序,Nutch 就是基于 Hadoop 开发的。
阅读全文>
发表于 @ 2007年09月09日 17:56:00|评论(loading...)|编辑
Hadoop是一个分布式的文件系统,目前已经使用到Nutch这个开源的搜索引擎项目中作为Lucene,本文就是我在网上找到一篇大致关于Hadoop原理和安装部署的文章,写的还不错,值得一看哦。阅读全文>
发表于 @ 2007年09月09日 17:51:00|评论(loading...)|编辑
libwww是一个非常著名而且权威的网页抓取处理开发库,函数复杂,功能强大,虽然现在使用的人不多,但是需要做复杂处理的时候,还有非常不错的,本文是转载的这个库的入门手册。阅读全文>
发表于 @ 2007年07月15日 14:49:00|评论(loading...)|编辑
网页抓取和ftp访问是目前很常见的一个应用需要,无论是搜索引擎的爬虫,分析程序,资源获取程序,WebService等等都是需要的,自己开发抓取库当然是最好了,不过开发需要时间和周期,使用现有的Open source程序是个更好的选择,一来别人已经写的很好了,就近考验,二来自己使用起来非常快速,三来自己还能够学习一下别人程序的优点。闲来无事,在网上浏览,就发现了这些好东西,特别抄来分享分享。主要就是libwww、libcurl、libfetch 这三个库,当然,还有一些其他很多更优秀库,文章后面会有简单的介绍。
阅读全文>
发表于 @ 2007年07月15日 14:43:00|评论(loading...)|编辑
随便贴一个libhash中的hash函数,写的貌似不错,贴出来玩玩。
阅读全文>
发表于 @ 2007年06月18日 21:38:00|评论(loading...)|编辑
在大家苦苦的为在线人数的增长而导致的系统资源吃紧上的问题正在发愁的时候,Linux 2.6内核中提供的System Epoll为我们提供了一套完美的解决方案。传统的select以及poll的效率会因为在线人数的线形递增而导致呈二次乃至三次方的下降,这些直接导致了网络服务器可以支持的人数有了个比较明显的限制。
阅读全文>
发表于 @ 2007年05月29日 15:14:00|评论(loading...)|编辑