Search Engine
_佚名-2022_
道虽迩,不行不至;事虽小,不为不成。
展开
-
搜索引擎之倒排索引
1.倒排索引 倒排索引(Inverted index),也常被称为反向索引、置入档案或反向档案,是一种索引方法,被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。它是文档检索系统中最常用的数据结构。通过倒排索引,可以根据单词快速获取包含这个单词的文档列表。倒排索引主要由两个部分组成:“单词词典”和“倒排文件”。关于倒排索引的介绍:http://blog.原创 2014-01-20 18:04:38 · 892 阅读 · 0 评论 -
搜索引擎架构图
1.搜索引擎架构图原创 2013-11-20 19:48:17 · 3648 阅读 · 0 评论 -
搜索引擎的分类
搜索引擎按其工作方式主要可分为三种:全文搜索引擎(Full Text Search Engine)目录索引类搜索引擎(Search Index/Directory)元搜索引擎(Meta Search Engine)1.全文搜索引擎 全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、原创 2014-01-20 16:54:04 · 3629 阅读 · 0 评论 -
搜索引擎之网络爬虫
通用搜索引擎的处理对象是互联网网页,目前网页数量以百亿计,搜索引擎的网络爬虫能够高效地将海量的网页数据传下载到本地,在本地 形成互联网网页的镜像备份。它是搜索引擎系统中很关键也很基础的构件。 1.网络爬虫的原理 网络爬虫的本质就是http请求获得互联网中Web服务器的网页。 网络爬虫采用浏览器式的方式来获取网页,过程如下: a)客户原创 2014-01-20 17:48:50 · 759 阅读 · 0 评论 -
SEO | SPAM
1两者的目的是一样的,都是为了追求在搜索引擎上的高排名;但手段不同,SEO是良性的,采用正常的方法优化网站,而SPAM则是作弊,通过不被搜索引擎认可的手段提高排名,一旦被发现,将会受到惩罚。说seo和spam的区别就有点类似说白帽和黑帽之间的区别类似。原创 2014-07-04 10:37:05 · 817 阅读 · 0 评论 -
搜索引擎使用中的奇技淫巧
搜索引擎使用中的奇技淫巧(1)双引号 把搜索词放在双引号中,代表完全匹配搜索,也就是说搜索结果返回的页面包含双引号中出现的所有的词,连顺序也必须完全匹配。bd和Google 都支持这个指令。例如搜索:"seo方法图片"(2)减号 减号代表搜索不包含减号后面的词的页面。使用这个指令时减号前面必须是空格,减号后面没有空格,紧跟着需要排除的词。Googl转载 2016-07-14 00:04:17 · 578 阅读 · 0 评论