- 博客(17)
- 资源 (5)
- 收藏
- 关注
转载 免费搜索引擎登录入口
百度免费登录入口 http://www.baidu.com/search/url_submit.htm 新浪免费登录入口 http://bizsite.sina.com.cn/newbizsite/docc/index-2jifu-09.htm 搜狐免费登录入口http://db.sohu.com/regurl/regform.asp?Step=REGFORM&class= 天网免费登录入口 ht
2006-07-27 09:07:00 39357 1
转载 The Google File System
ABSTRACTWe have designed and implemented the Google File System,a scalable distributed file system for large distributeddata-intensive applications. It provides fault tolerance whilerunning on inexpen
2006-07-26 10:27:00 3060
转载 Google文件系统
Google文件系统 GFS是一个可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。它运行于廉价的普通硬件上,但可以提供容错功能。它可以给大量的用户提供总体性能较高的服务。 1、设计概览 (1)设计想定 GFS与过去的分布式文件系统有很多相同的目标,但GFS的设计受到了当前及预期的应用方面的工作量及技术环境的驱动,这反映了它与早期的文件系统明显不同的设想。这就需要对传统的选择
2006-07-26 10:23:00 988 1
转载 基于Linux的搜索引擎实现
搜索引擎是为用户提供快速获取网页信息的工具,其主要的功能是系统通过用户输入关键字,检索后端网页数据库,将相关网页的链接和摘要信息反馈给用户。从搜索的范围上一般分为站内网页搜索和全局网页搜索。随着网页数量的急剧增加,搜索引擎已经成为上网查询信息的必须手段,各个大型网站均已经提供网页数据搜索服务,并且出现了许多为大型网站提供专业搜索引擎服务的公司,如为Yahoo提供搜索服务的Google,为新浪网和
2006-07-24 13:05:00 1218
转载 Google搜索技术揭秘
引:Google将其成功部分地归功于公司所发明的独有运算机制,令其搜索引擎可以在极短时间内对数以百万计的网络用户的搜索请求提供答案。 上周三,Google副总裁Urs Hoelzle在Eclipse会议上的一番发言,令与会者有机会 了解Google的搜索技术是如何产生以及该技术现在是如何运作的。 Hoelzle对与会者说,要发明Google的技术,开发者必须抛弃过去大型数据库所使用技术
2006-07-20 17:12:00 1074
原创 中文分词
在网上找了n天的关于中文分词的文章,发现一些有用的资源:1、计算所汉语词法分析系统 ictclas 提供源代码C++的,不过好象编译之后和作者提供的程序分词结果有出入,源代码研究中。2、猎兔推出的ictclas 的 .net版本 http://www.lietu.com/doc/LuceneDotNetSeg.htm 试用版,可以反编译,有同样问题,分词的结果不是很理想。3、www.r
2006-07-20 16:45:00 1168 1
转载 中文搜索引擎技术揭密:中文分词
前言 信息的飞速增长,使搜索引擎成为人们查找信息的首选工具,Google、百度、中国搜索等大型搜索引擎一直是人们讨论的话题。随着搜索市场价值的不断增加,越来越多的公司开发出自己的搜索引擎,阿里巴巴的商机搜索、8848的购物搜索等也陆续面世,自然,搜索引擎技术也成为技术人员关注的热点。 搜索引擎技术的研究,国外比中国要早近十年,从最早的Archie,到后来的Excite,以及altvista
2006-07-19 09:31:00 995
转载 中文搜索引擎技术揭密:网络蜘蛛
随着搜索经济的崛起,人们开始越加关注全球各大搜索引擎的性能、技术和日流量。作为企业,会根据搜索引擎的知名度以及日流量来选择是否要投放广告等;作为普通网民,会根据搜索引擎的性能和技术来选择自己喜欢的引擎查找资料;作为学者,会把有代表性的搜索引擎作为研究对象…… 而作为一个网站的经营者,其更关心的或许是如何通过网络载体让更多的网民知道自己的网站,进而获得更高的流量和知名度。这其中,搜索引擎已经成了一个
2006-07-19 09:29:00 1162
转载 中文搜索引擎技术揭密:系统架构
互联网发展的今天,一方面离不开其开放、共享的特性带给人们的全新体验,另一方面也离不开数以亿计的为其提供各类丰富内容的网络节点。互联网被普及前,人们查阅资料第一想到的便是拥有大量书籍资料的图书馆,到了今天你怎么想?或许今天的很多人都会选择一种更方便、快捷、全面、准确的方式——互联网。你可以坐在家里轻点几下鼠标就查到想要的各类信息,这在互联网没有被普及之前,还都仅是一个梦而已,但如今这一切已成为了可能
2006-07-19 09:28:00 1165
转载 中科院分词系统概述
中科院分词系统概述这几天看完了中科院分词程序的代码,现在来做一个概述,并对一些关键的数据结构作出解释〇、总体流程考虑输入的一句话,sSentence="张华平欢迎您"总体流程:一、分词 "张/华/平/欢迎/您"二、posTagging "张/q 华/j 平/j 欢迎/v 您/r"三、NE识别:人名识别,音译名识别,地名识别 "张/q 华/j 平/j 欢迎/v 您/r
2006-07-17 16:38:00 1757
转载 为lucene加入简单中文分词
看到很多人做lucene的应用时候都要面临中文分词怎么加的问题,下面介绍一个简单的中文词库,这个词库附带相应的算法,数据结构学过的人看懂没什么问题,只要简单的构造一个对象,就可以分词了,对于不是太大的应用来说,还是相当可行的,点击下载 该分词库使用很简单,先初试化该类 ChineseSegmenter seg = ChineseSegmenter.getGBSegmen
2006-07-17 10:41:00 1308
转载 编写和执行单元测试
编写和执行单元测试2.1. 使用NUnit2.2. 测试技巧:测试哪些内容在这个部分中,主要包括两个方面的内容。如何编写NUnit测试代码(测试代码的格式),以及测试的基本原则(测试代码的内容)。 2.1.1. 构建单元测试测试代码必须做以下几件事情:1. 准备测试所需的条件2. 调用要测试的方法3.
2006-07-14 14:12:00 1103
转载 汇编指令手册
一、数据传输指令 它们在存贮器和寄存器、寄存器和输入输出端口之间传送数据. 1. 通用数据传送指令. MOV 传送字或字节. MOVSX 先符号扩展,再传送. MOVZX 先零扩展,再传送. PUSH 把字压入堆栈. POP 把字弹出堆栈. PUSHA 把AX,CX,DX,BX,SP,BP,SI,DI依次压入堆栈. POPA 把DI,SI,BP
2006-07-11 17:25:00 1220
转载 涉世之初十个忠告
如何在涉世之初少走弯路,有一个好的开端,开始一番成功的事业?以下是一些先行者积累的10条有益的涉世忠告。好好地遵循、把握这些忠告和建议吧,比起所学的课堂课程来,它毫不逊色!1. 买个闹钟,以便按时叫醒你。贪睡和不守时,都将成为你工作和事业上的绊脚石,任何时候都一样。不仅要学会准时,更要学会提前。就如你坐车去某地,沿途的风景很美,你忍不住下车看一看,后来虽然你还是赶到了某地,却不是准时到达。
2006-07-11 16:54:00 1461 1
转载 Net下的数据备份和还原
◆数据备份 : /// /// 备份数据库 /// private void btnBackUp_Click(object sender, System.EventArgs e) { this.Cursor = Cursors.WaitCursor; this.label1.Text = " 正在进行档案库的数据备份,这可能需要几秒到几十的时间,请稍候..."; this
2006-07-06 09:20:00 748
转载 C#开发windows程序技巧
1.一个应用程序只能被用户打开一次 Process mobj_pro =Process.GetCurrentProcess(); Process[] mobj_proList=Process.GetProcessesByName(mobj_pro.ProcessName); if(mobj_proList.Length>1) {
2006-07-03 11:43:00 1169
Remotesoft Salamander .NET Linker and Mini-deployment Tool 2.1
2010-09-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人