Boost搜索引擎项目详解
从零开发一款对接Boost官网的简单的搜索引擎,过程中穿插个人对搜索引擎相关技术的总结和理解。
暂代
须知少日拿云志,曾许人间第一流。
展开
-
从零开发一个简单的搜索引擎-索引模块第一部分
注:本模块会大量用到protobuf库、cppjieba库,不了解的读者可以先去简单了解一下这两个库怎么使用,这里就不赘述了。一、对Boost官网网页的预处理注:这个过程用什么语言处理都可以由于Boost官网的数据都是以网页的形式呈现的,但是制作索引的时候直接对网页进行操作就比较麻烦,所以这个阶段就是对Boost官网的网页数据先做一个预处理,将它变成制作索引的时候容易处理的形式。...原创 2019-07-31 22:31:49 · 1153 阅读 · 0 评论 -
Boost库安装及使用记录
Boost库是为C++语言标准库提供扩展的一些C++程序库的总称。文章目录一、前言Linux下安装Boost库二、Boost algorithm字符串切分字符大小写转换字符替换一、前言如果想要在项目中使用Boost库,首先要在开发环境安装Boost库。这里提供Linux Centos7.2开发环境下安装 Boost1.67 的方法。Linux下安装Boost库 1. 到官网下载需...原创 2019-05-12 11:15:02 · 481 阅读 · 0 评论 -
gflags简明使用指南
一、gflags简单介绍gflags是google开源的一套命令行参数解析工具。通常在项目开发中会有一种需求:可以在代码运行的时候指定某些代码中某些参数的值如果没有显式指定,这些参数可以使用默认的值比如:服务器编程中需要用到IP和端口号。但是这两个变量有时候在具体使用程序的时候才会有具体的值,如果不用gflags可以这么写://test.cc#include <iostrea...原创 2019-07-16 14:08:49 · 1251 阅读 · 0 评论 -
从零开发一个简单的搜索引擎-公共模块
为了让项目尽可能的解耦和,把项目中大多数模块都用到的自定义功能函数以及和模块具体业务无关的函数以 header-only的形式封装成一个头文件,其他模块需要使用这些函数,直接包含这个头文件即可。这个头文件也算是可以自成半个模块吧。注:这半个模块是在开发其他模块的过程中不断添加代码的,在这里博主将这个模块最终所包含的函数这里全部列举出来,方便读者理解。一、字符串1. 字符串的无损切割...原创 2019-07-30 20:02:11 · 349 阅读 · 0 评论 -
从零开发一个简单的搜索引擎-综述
简述搜索引擎是一个技术含金量非常高的话题,本着学习和提高的目的,在一个前辈的指点下,之前开发了一个对接Boost官网的站内搜索引擎,在学习和开发的过程中我的收获很大,了解和掌握了很多技术细节,也复习了以前学过但是不是非常熟悉的一些知识。打算把开发的整个过程做一个详细的总结,期间穿插个人对搜索引擎相关技术的总结和理解。说明项目中会用到的第三方库:cppjiebactemplategfl...原创 2019-07-30 18:02:52 · 603 阅读 · 0 评论