搜索引擎
千瞱
世界上没有完美的程序,但我们并不因此而沮丧,因为写程序本来就是一个不断追求完美的过程。
展开
-
搜索引擎学习之旅3 - 搜索引擎工作流程
搜索引擎之旅系列往期文章: 中文搜索引擎原理分析与实现(1)基本理论 搜索引擎学习之旅1 - SEO的概念 搜索引擎学习之旅2 - 搜索引擎分类 前面的文章只是介绍了一些搜索引擎相关的概念,本文就介绍一下搜索引擎的完整工作流程。搜索页面的输入框是用户和搜索引擎进行交互的接口,其实这个搜索框仅仅是搜索引擎的冰山一角,可以思考一下几个问题: 搜索引擎返回的数据怎么来的? 搜索引擎如何准确地...原创 2020-04-04 22:37:08 · 972 阅读 · 0 评论 -
搜索引擎学习之旅2 - 搜索引擎分类
搜索引擎也是可以分为很多种的,拿日常生活举例,大家经常用的Google/百度是搜索引擎,在app里最上边的搜索栏搜索商品/商店/anything else的也是搜索引擎。但是上面的搜索引擎并不是同一种,因此在本文我就梳理一下搜索引擎的种类。 1 全文搜索引擎 这是大家都知道的一种搜索引擎,较为典型的是百度/Google搜索引擎,全文搜索引擎也是难度最高的搜索引擎,需要使用爬虫从互联网上爬取各个...原创 2020-04-04 21:41:03 · 677 阅读 · 0 评论 -
搜索引擎学习之旅1 - SEO的概念
1 什么是搜索引擎 我曾在研究生课程中接触过搜索引擎,当时也写了一篇搜索引擎介绍的文章中文搜索引擎原理分析与实现(1)基本理论, 想对搜索引擎有更详细的了解可以去看一下这篇文章。 那么什么是搜索引擎呢?长话短说:搜索引擎本质上就是一个检索系统,为用户提供信息检索服务的。为了在海量数据中快速的找到符合用户搜索内容的结果,搜索引擎会用到倒排索引。所谓的倒排索引就是使用网页中的关键词内容作为索引的...原创 2020-04-04 13:39:53 · 608 阅读 · 0 评论 -
中文搜索引擎原理分析与实现(1)基本理论
说起搜索引擎,我们肯定会说百度!谷歌!当然,这些人人皆知的检索系统当然属于搜索引擎,不过在app里,在论坛上都会有一个搜索框,大部分的搜索框的背后都有一个或大或小的搜索引擎。搜索引擎本质上就是一个检索系统,为用户提供信息检索服务的。那么搜索引擎到底是如何实现的呢? 起初,我有一个懵懂的想法:搜索引擎就是在数据库里查找数据是否满足我们输入的查询内容吧!比如,我输入“西安交通大学”,那么就相当于在数...原创 2019-01-25 18:41:01 · 962 阅读 · 0 评论 -
中文搜索引擎原理分析与实现(2)实现篇之爬取数据
上一篇文章介绍了搜索引擎的核心原理——搜索引擎,从本篇开始我们动手实现搜索引擎。本篇主要介绍数据采集部分的内容,使用Scrapy爬虫框架爬取数据。以爬取新浪新闻为例,介绍如何爬取数据。 1 先让Scrapy跑起来——使用方法介绍(本节内容参考自Scrapy教程) Scrapy是Python的一个web数据爬取框架,安装Scrapy也非常简单,可以通过pip安装,也可以在anaconda中...原创 2019-03-03 12:09:38 · 662 阅读 · 0 评论