关闭

【转载】搜索引擎如何对付“暗网”

 【转载】搜索引擎如何对付“暗网”          网海无边,回头是岸。    摆在搜索引擎面前的难题很多,剪不断,理还乱,但有一个怎么绕也绕不开——暗网(hidden web)。互联网上每天都在诞生无穷无尽的新信息,这些信息存在的方式也无穷无尽——文字、声音、图像、交互数据,或者别的。    面对信息存在状态的多元化,内容的海量化,人类很焦虑,总想探求冰山底下不为人知的世界,这便是技术的伟大之...
阅读(469) 评论(0)

The Semantic Search Engine

How the Search Engines of the future are going to operate is anybody’s guess, and guessing about the future is always hard. If you read up on the subject in the more theoretical parts of the net, if y...
阅读(681) 评论(0)

The Road to the Semantic Web

The Road to the Semantic Web Written by Alex Iskold / November 14, 2006 / 14 commentsWritten by Alex Iskold and edited by Richard MacManus. John Markoffs recent article in NY Times has ...
阅读(441) 评论(0)

Semantic Web

Semantic Web: SPARQL——RDF查询语言2006年12月1日 11:19:19 发布:guwendong SPARQL,和“sparkle”的发音一样,它是一种 RDF 查询语言,可以从 RDF 图中查询信息。在 W3C Technical Reports and Publications 页面上,我们可以看到,现在和 SPARQL 相关的共有三项内容:其中两个是...
阅读(1390) 评论(0)

投资者寄望语义搜索技术超越谷歌

导语:《红鲱鱼》杂志近日发表分析文章称,越来越多的创业者和投资者对于下一代网络技术——“语义网”(semantic web)寄予厚望,认为它可以帮助用户更加方便、快捷地查找信息,从而有望超越当前的网络搜索巨头谷歌。  什么是语义网  语义网的基础是一种新型搜索技术,通过这一技术,用户只需使用日常语言输入问题,就可以获得想要的答案。下一代搜索引擎的开发者认为,他们的技术能“理解”用户所使用的...
阅读(599) 评论(0)

智能化的语义搜索引擎——hakia

施乐公司(Xerox corp)也推出搜索引擎了,这款昨日刚推出的搜索引擎是被定义为智能化的语义搜索引擎("smart" search engine)的hakia。hakia是互联网上一款新的“基于词意(meaning-based)”的(语义)搜索引擎,它的唯一目的在于提高搜索相关性和交互性,以帮助搜索用户提高搜索效率,获取更丰富的信息,节约搜索时间,hakia目前只提供网页搜索服务。hakia的...
阅读(2523) 评论(0)

发现搜索的价值:走出语义搜索的误区

第三代搜索,作为对以Google为代表的第二代搜索范式的超越或者说革新,时下正逼近一个重要的时间拐点。这股范式转型潮流由多条支流组成,其中一个支流是包含本地化搜索、社区内容搜索、知识问答社区等在内的社会化搜索,另一个支流则是人工智能、模式识别、语义分析、神经网络等智能搜索。  可以说,就技术门槛而言,智能搜索代表了下一代搜索的主流趋势。但鉴于基于神经网络、人工智能的搜索耗资巨大,目前还处在试验...
阅读(611) 评论(0)

文献密码搜索的方法大全

一、文献密码搜索的方法概述文献密码搜索的方法精要总结如下: 1.google是密码搜索的利器 2.标准检索表达式:杂志名(数据库名)+password+username 3.检索表达式的变异(pw, pwd等衍生词) 4.冗余信息的去除(-NEED) 5.密码的区域性问题 (site:EDU,KR,TW) 6.文件类型限制 7.INTITTLE/link等限制的妙用 8.著名杂志带其他杂志 9...
阅读(3247) 评论(0)

Deep Web Research 2005

Deep Web Research 2005By Marcus P. ZillmanMarcus P. Zillman, M.S., A.M.H.A., is Executive Director of the Virtual Private Library and Founder/Creator of BotSpot? He is the author of nine d...
阅读(2289) 评论(0)

计算机专业时文选读:Deep Web

Deep Web Most writers these days do a significant part of their research using the World Wide Web, with the help of powerful search engines such as Google and Yahoo. There is so much information avail...
阅读(1190) 评论(0)

网络爬虫

随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战。搜索引擎(Search Engine),例如传统的通用搜索引擎AltaVista,Yahoo!和Google等,作为一个辅助人们检索信息的工具成为用户访问万维网的入口和指南。但是,这些通用性搜索引擎也存在着一定的局限性,如:  (1) 不同领域、不同背景的用户往往具有不同的检索目的和需求,通用搜索...
阅读(1282) 评论(0)

DeepWeb搜索文章-《查找"看不见的网页"的途径与工具》

查找"看不见的网页"的途径与工具邢志宇刑老师的文章值得细看与学习!  "看不见的网页"(The Invisible Web)是指搜索引擎商出于自身考虑不愿索引的某些网络内容,或是因为技术原因普通搜索引擎(popular search engines)无法索引的网络内容。这些普通搜索引擎的"蜘蛛"不容易接近的"深层网络"(deep Web)的数量,要比搜索引擎索引的网页(visible ...
阅读(977) 评论(0)

第19次中国互联网发展状况统计报告

http://tech.tom.com/zhuanti/CNNIC_Report19.html  ...
阅读(560) 评论(0)

Deep Web(深层网络or深度网络)

深层网络:揭示网络中隐藏的价值  World Wide Web(简称WWW,或Web网)自20世纪90年代发明以来就一直呈现蓬勃发展之势,到今天为止其蕴含着海量的丰富资源,包罗万象,是人类一笔宝贵的知识财产。Web网按其分布状况可以分为“表层网”(Surface Web)和“深层网”(Deep Web,也有称Invisible Web,HiddenWeb)。  Surface Web指存储在Web...
阅读(2347) 评论(0)

中英文混合分词

无需词典的中英文混合分词 V1.0  废话不说那么多了, 看了程序,你就啥都明白了!  描述:无需词典的中英文混合分词 V1.0 (可下载)  下载地址: http://www.ganjoy.com/job.php?action=download&pid=tpc&tid=130&aid=38   ...
阅读(869) 评论(1)

本体库的建立与标注

 本观点:本体的建立及本体库的标注问题; 在本体的建模阶段,大部分的建模工作都集中在领域知识的抽象表示上,即发现领域内的概念、概念的继承层次、潜在的关系和公理等。对于领域中的实例,在建模时一般不需要考虑它们,除非建模时就能确定该本体所涉及的所有实例。实际上,通常的本体都具有一定的通用性,表示特定领域内的知识,但由于领域内可能的实例数目无穷无尽且动态变化,因此,只有本体和一个具体的应用结合时考虑实例...
阅读(3324) 评论(2)

301重定向的实现方法

页面永久性移走(301重定向)是一种非常重要的“自动转向”技术。  301重定向可促进搜索引擎优化效果  从搜索引擎优化角度出发,301重定向是网址重定向最为可行的一种办法。当网站的域名发生变更后,搜索引擎只对新网址进行索引,同时又会把旧地址下原有的外部链接如数转移到新地址下,从而不会让网站的排名因为网址变更而收到丝毫影响。同样,在使用301永久性重定向命令让多个域名指向网站主域时,亦不会...
阅读(473) 评论(0)

Anchor text 的重要性

Anchor text 的重要性2007-03-15 17:16 在google中搜索“技术点评”,可以看到 HighDiy IT技术点评 在SERP页面中排到第二位。虽然严格说起来,“技术点评”不能算是一个竞争性很激烈的关键词,不过,能在3千万个页面中排名第二还是让俺的虚荣心小小满足一把。 ...
阅读(1431) 评论(0)

实用小型搜索引擎[收集整理]

实用小型搜索引擎[收集整理]<!--google_ad_client = "pub-3178351830176495";google_ad_width = 336;google_ad_height = 280;google_ad_format = "336x280_as";google_ad_type = "text_image";//2006-11-30: gis...
阅读(623) 评论(0)

中文路径问题,中文url

中文路径问题,中文url 在使用rails的webrick过程中碰到中文url问题,原本认为很简单的事情其实并不简单。为了了解中文路径问题,特别在apache,iis下面做了试验。过程如下:首先要准备好gb2312和utf-8的文件名。这里使用python来获得。>>> s_gb=我.txt>>> print s_gb我.txt>>> s_gb/xce/x...
阅读(1685) 评论(0)
    个人资料
    • 访问:113466次
    • 积分:1475
    • 等级:
    • 排名:千里之外
    • 原创:26篇
    • 转载:26篇
    • 译文:1篇
    • 评论:8条