搜索
文章平均质量分 80
木叶叶叶
小白产品汪
展开
-
这就是搜索引擎(一)—引擎架构、网络爬虫、索引建立
这个系列的文章是一只试图通过产品角度出发去理解复杂庞大搜索引擎的汪写出来的,不足之处很多,欢迎广大技术、非技术同学阅读后指正错误,我们一起探讨共同进步。 本篇主要介绍搜索引擎的架构、网络爬虫、及索引建立。 一、搜索引擎基本信息 1.1 什么是搜索引擎 通俗来讲就是从互联网海量信息中捞出用户感兴趣的内容提供给用户。 1.2 发展历程 分类目录的:纯人工收集整理,代表是导航,如原创 2016-08-03 18:20:30 · 6725 阅读 · 0 评论 -
这就是搜索引擎(三)——搜索引擎优化
本章主要讲的是搜索引擎的优化,包括提高搜索效率(云存储、缓存机制)、提高搜索质量(网页去重、用户搜索意图识别、网页反作弊)及搜索的发展方向。这三个方面是在网页抓取&搜索排序的基础上发展起来的。原创 2016-08-29 13:21:14 · 5423 阅读 · 0 评论 -
这就是搜索引擎(二)—检索排序、链接分析
这个系列的文章是一只试图通过产品角度出发去理解复杂庞大搜索引擎的汪写出来的,不足之处很多,欢迎广大技术、非技术同学阅读后指正错误,我们一起探讨共同进步。 本篇主要介绍搜索引擎的检索模型和搜索排序。就是利用某种检索模型从海量数据中挑选“好的”网页经过排序后生成最终结果推送给用户。搜索结果排序是是搜索引擎最核心的部分,决定了搜索引擎质量好坏。排序中最重要的两个因素是查询内容相关性和网原创 2016-08-12 11:23:28 · 2416 阅读 · 0 评论