搜索引擎
东边的小山
这个作者很懒,什么都没留下…
展开
-
浅谈京东搜索关键词排名规则
本人在没有参加京东搜索训练营培训以前,一直从事的都是搜索引擎的优化工作。毫不吹嘘的说,对中文分词、以及用户的需求分析有一点自己的心得的。刚参加完上海站的培训,有点战战兢兢的,毕竟到上海的前一天,我才拿到公司的京东后台账号,当时实在担心,不知道京东后台如何操作的我,能否听懂京东搜索训练营的培训课程!王文峰老师,京东搜索引擎前掌门人 京东搜索训练营的培训课程,非常给力,个人在转载 2017-02-06 08:49:21 · 11787 阅读 · 0 评论 -
搜索引擎技术之查询处理
阅读目录1. 查询处理的流程2. 基于索引的查询处理 2.1 一次一文档查询处理 2.2 一次一单词查询处理 我们之前从开发者的角度谈了一些有关搜索引擎的技术,其实对于用户来说,我们不需要知道网络爬虫到底是怎样爬取网页的,也不需要知道倒排索引是什么,我们只需要输入我们的查询词query,然后能够得到我们想要的网页或者答案就可以了。这就是搜索引擎技术中相对顶层的转载 2017-12-05 08:17:46 · 498 阅读 · 0 评论 -
搜索引擎技术之倒排索引
阅读目录1. 倒排索引的思想2. “单词-文档矩阵”3. 倒排索引的基本框架4. 单词字典5. 倒排索引的实例 倒排索引是搜索引擎中最为核心的一项技术之一,可以说是搜索引擎的基石。可以说正是有了倒排索引技术,搜索引擎才能有效率的进行数据库查找、删除等操作。回到顶部1. 倒排索引的思想 倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引转载 2017-12-05 08:19:55 · 557 阅读 · 0 评论 -
搜索引擎技术之网络爬虫
阅读目录1. 网络爬虫技术基本工作流程和基础架构2. 网络爬虫的抓取策略3. 网络爬虫更新策略4. 分布式抓取系统结构5. 参考内容 随着互联网的大力发展,互联网称为信息的主要载体,而如何在互联网中搜集信息是互联网领域面临的一大挑战。网络爬虫技术是什么?其实网络爬虫技术就是指的网络数据的抓取,因为在网络中抓取数据是具有关联性的抓取,它就像是一只蜘蛛转载 2017-12-05 08:22:42 · 1287 阅读 · 0 评论 -
搜索引擎分类和基础架构概述
阅读目录1. 搜索引擎分类2. 搜索引擎的基础架构 大家一定不会多搜索引擎感到陌生,搜索引擎是互联网发展的最直接的产物,它可以帮助我们从海量的互联网资料中找到我们查询的内容,也是我们日常学习、工作和娱乐不可或缺的查询工具。之前本人也是经常使用Google和Baidu搜索,而对搜索引擎的知识架构没有一个整体的概念。前一阵子的实习,使我有机会全面的了解了搜索引擎,转载 2017-12-05 08:24:13 · 2159 阅读 · 0 评论 -
Elasticsearch 基于Lucene的全文搜索引擎服务器介绍
ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。我们建立一个网站或应用程序,并要添加搜索功能,但是想要完成搜索工作的创建...转载 2018-10-25 10:19:58 · 1146 阅读 · 0 评论 -
搜索引擎不收录网站页面的常见原因
1、网页使用框架:框架内的内容通常不在搜索引擎抓取的范围之内。 2、图片太多,文本太少。 3、提交页面转向另一网站:搜索引擎可能完全跳过这个页面。 4、提交太过频繁:一个月内提交2次以上,很多搜索引擎就受不了,认为你在提交垃圾。 5、网站关键词密度太大:不幸的是搜索引擎并没解释多高的密度是极限,一般认为100个字的描述中含有3-4个关键词为最佳。 6、文本颜色跟背景色...转载 2019-07-20 10:55:30 · 2899 阅读 · 0 评论