![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
搜索引擎项目
文章平均质量分 66
Young_LAS
一点一点的成长
展开
-
gflags 命令行参数配置库
gflag介绍google开源的gflags是一套命令行参数解析工具主要就是用来解析命令行参数,并且支持从文件或者从环境变量中读入参数,功能十分强大gflag的使用我们以使用为目标进行讲解,不会进行深入了解(其实并不是很难,有兴趣的朋友可以多去了解一下),仅仅让你知道gflags可以怎么快速的,直接使用起来。至于gflags的安装也不进行过多的介绍,可以自行搜索。头文...原创 2018-08-06 11:49:40 · 1668 阅读 · 0 评论 -
glog库
glogglog是google开源的程序级日志库,我们同样也可以用在我们的项目上面,来作为程序的日志监控。glog库,使用起来非常方便,且功能同样非常强大。日志的级别有四种:INFO(正常) ,WARNING(警告),ERROR(错误),FATAL(致命)日志会存放在你自定义的路径下使用过程的介绍整个使用过程分为三步,第一步初始化,第二步选择存放日志的路径,之后在要使用...原创 2018-08-06 14:29:28 · 1044 阅读 · 0 评论 -
Google protobuf 用于数据的存储/序列化/反序列化
protobuf介绍谷歌开源的Protocol Buffer,简称protobuf,是一种轻便高效的结构化数据存储格式,可以用于结构化数据序列化,且不受平台和语言的限制。简单来说,如果你需要存储数据,且这些数据为多个程序所共享,涉及数据的传输与接收问题,需要数据的序列化与反序列化,那么protobuf就非常适合你了。它不但可以帮你完成数据的存储,数据传输时的序列化和反序列化,并且适用于不同...原创 2018-08-06 17:53:38 · 4130 阅读 · 0 评论 -
Python中一些简单常用的处理文件方法
改变文档的编码import sysreload(sys)sys.setdefaultencoding('utf-8')加上上面的三行之后就可以正常的显示或使用中文。os.walk( top ) os.walk() 方法用于通过在目录树中游走输出在目录中的文件名,向上或者向下。os.walk() 方法是一个简单易用的文件、目录遍历器,可以帮助我们高效的处理文件、目...原创 2018-08-14 19:08:06 · 272 阅读 · 0 评论 -
网页搜索引擎中的核心索引结构 - 利用 Google Protobuf 构建
索引结构 — Index利用 Google Protobuf 构建索引结构 —– Index在搜索引擎中,常见的索引方法就是正排索引和倒排索引,因此我们 Index 索引结构要包括两两个方面:正排索引 — ( forward_index )倒排索引 — ( inverted_index )正排索引正排索引是根据文件的id号,得到所有的文件信息,因此正排索引中存放的是...原创 2018-08-15 15:31:49 · 666 阅读 · 0 评论 -
搜索引擎项目
搜索引擎项目一. 项目介绍1. 基本思路:模拟百度搜索的方式实现站内搜索引擎,整个项目分为两大部分,HTTP服务器和搜索服务器:HTTP服务器的功能就是接受用户数据,显示索引结果搜索服务器分为客户端和服务器端,客户端来负责提取有用的信息,服务器端来进行检索2. 模块划分整体分为4个模块:HTTP服务器搜索客户端(CGI程序)搜索服务器(RPC框架)索引...原创 2018-08-22 22:43:34 · 3461 阅读 · 0 评论 -
Linux下的stat函数
stat 函数函数原型 #include <sys/stat.h>int stat(const char *file_name, struct stat *buf);函数说明: 通过文件名filename获取文件信息,并保存在buf所指的结构体stat中返回值: 执行成功则返回0,失败返回-1,错误代码存于errnostruc...原创 2018-08-17 19:45:01 · 666 阅读 · 0 评论