搜索引擎
qachenzude
这个作者很懒,什么都没留下…
展开
-
Offline Explorer简介
Offline Explorer V4.5.2532 SR1 软件大小: 2525 KB 软件语言: 英文 软件类别: 国外软件 / 共享版 / 离线浏览 应用平台: Win9x/NT/2000/XP/2003 相当方便使用的离线浏览工具,可排定抓取时间、设定Proxy,也可选择抓取的项目及大小,可自设下载的存放位置、及存放的空间限制。它内置浏览程原创 2011-12-02 15:53:16 · 1156 阅读 · 0 评论 -
Aardvark_社交和日常生活信息搜索引擎。
Aardvark(http://vark.com/)是一款社交和日常生活信息搜索引擎。公司总部为美国加州旧金山市.。 Aardvark创建于2007年,主要提供公众日常社交信息的查找(social search service),如用户可利用即时通信、电子邮件等工具,键入诸如“美国帕罗奥托市技术最好的牙医是谁”等问题,Aardvark将返回相应答案。目前Aardvark已获得700万美元风原创 2012-12-27 11:59:04 · 833 阅读 · 0 评论 -
Vivisimo_实现聚类的元搜索引擎
Vivisimo是一个搜索引擎,由Carnegie Mellon大学计算机科学系的科学家们建立的,源自1998年美国国家科学基金会资助的一个实验项目,该项目主要是为了解决信息超载问题。基于对该问题的研究,提出了新的文献类聚方法。研究者的理念是:让软件开发商来处理隐含的复杂性,比让众多的计算机用户陷入复杂的、混乱的输出结果要好得多。 2000年6月成立Vivisimo公司,其目的是将这个项目成果原创 2012-12-27 11:51:08 · 931 阅读 · 0 评论 -
知识引擎WolframAlpha
WolframAlpha是开发计算数学应用软件的沃尔夫勒姆研究公司开发出的新一代的搜索引擎,能根据问题直接给出答案的网站,于 5月15日晚7点(美国中部当地时间,北京时间5月16日上午8点)提前上线,用户在搜索框键入需要查询的问题后,该搜索引擎将直接向用户返回答案,而不是返回一大堆网页链接。原创 2012-12-27 11:27:11 · 1119 阅读 · 0 评论 -
百度搜索引擎代码
百度搜索引擎代码 468*50<iframe id="baiduframe" border="0" vspace="0" hspace="0" marginwidth="0" marginheight="0"framespacing="0" frameborder="0" scrolling="no" width="468" height="50"src="http://unstat.原创 2012-07-25 11:02:13 · 2679 阅读 · 1 评论 -
Exception in thread "main" java.lang.OutOfMemoryError: Java heap space解决方法
问题描述Exception in thread "main" java.lang.OutOfMemoryError: Java heap space解决方案[转]一直都知道可以设置jvm heap大小,一直用eclipse写/调试java程序。一直用命令行or console加参数跑程序。现象:在eclipse的配置文件eclipse.ini中设置-vmargs -Xms500m -X转载 2012-06-06 20:56:57 · 1207 阅读 · 0 评论 -
compass --封装了Lucene的搜索框架
Compass是一个强大的,事务的,高性能的对象/搜索引擎映射(OSEM:object/search engine mapping)与一个Java持久层框架.Compass包括: * 搜索引擎抽象层(使用Lucene搜索引荐), * OSEM (Object/Search Engine Mapping) 支持, * 事务管理, * 类似于Google的简单关键字查询语言,原创 2012-06-05 13:43:11 · 860 阅读 · 0 评论 -
Nutch是一个由Java实现的,刚刚诞生开放源代码(open-source)的web搜索引擎。
Nutch是一个由Java实现的,刚刚诞生开放源代码(open-source)的web搜索引擎。 尽管Web搜索是漫游Internet的基本要求, 但是现有web搜索引擎的数目却在下降. 并且这很有可能进一步演变成为一个公司垄断了几乎所有的web搜索为其谋取商业利益.这显然不利于广大Internet用户. Nutch为我们提供了这样一个不同的选择. 相对于那些商用的搜索引擎,原创 2012-06-05 15:28:15 · 718 阅读 · 0 评论 -
MemCache--缓存软件
Memcache是一个高性能的分布式的内存对象缓存系统,通过在内存里维护一个统一的巨大的hash表,它能够用来存储各种格式的数据,包括图像、视频、文件以及数据库检索的结果等。简单的说就是将数据调用到内存中,然后从内存中读取,从而大大提高读取速度。 Memcache是danga的一个项目,最早是LiveJournal 服务的,最初为了加速 LiveJournal 访问速度而开发的,后来被很原创 2012-06-04 20:43:55 · 464 阅读 · 0 评论 -
HTMLParser使用
HTMLParser具有小巧,快速的优点,缺点是相关文档比较少(英文的也少),很多功能需要自己摸索。对于初学者还是要费一些功夫的,而一旦上手以后,会发现HTMLParser的结构设计很巧妙,非常实用,基本你的各种需求都可以满足。 这里我根据自己这几个月来的经验,写了一点入门的东西,希望能对新学习HTMLParser的朋友们有所帮助 HTMLParser的核心模块是org原创 2011-12-18 13:56:24 · 627 阅读 · 0 评论 -
Java抓取网页乱码解决
昨天用java抓取html文件,获取下来的html文件打开总是带有乱码,弄了半天搞定了。其实要避免乱码的一个好方法:没有必要去判断页面的编码方式,只要读取的数据按字节(而不是按字符)保存起来就可以了,后缀为html文件,然后用浏览器打开,肯定是正常的。 分析的原因:在网络上传送的数据是基于字节流的,我们要在屏幕上显示的时候要将字节流按某种字符集解码成String的形式,在java中转载 2011-12-04 20:35:24 · 6362 阅读 · 3 评论 -
HTML解析器 jsoup
jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操作方法来取出和操作数据。jsoup的主要功能如下:从一个URL,文件或字符串中解析HTML; 使用DOM或CSS选择器来查找、取出数据; 可操作HTML元素、属性、文本; jsoup是基于MIT协议发布的,可放心使原创 2011-12-04 20:18:44 · 651 阅读 · 0 评论 -
声音检索引擎- midomi.com
用自己的声音唱歌或哼唱来搜索音乐、观看音乐视频、加入歌迷俱乐部、与朋友分享、被发现以及进行许多其它活动,不收取任何费用! - midomi.com Midomi (www.midomi.com)是总部位于硅谷的 Melodis Corporation 出品的一款依靠哼唱歌曲旋律来搜索歌曲信息的搜索引擎。 Midomi 基于你的声音搜索,因此是终极乐曲搜索工具。唱歌、哼歌或者吹口哨就原创 2012-12-27 11:38:09 · 1889 阅读 · 0 评论