- 博客(10)
- 资源 (2)
- 问答 (2)
- 收藏
- 关注
原创 python3 多线程篇1
1 前言虽然说Python的运行效率比不过像C++/Java这样的大哥,但是其代码简练、相关数据处理工具包多、开发快等特点真的很诱人。之前一直用Python写单进程程序,但最近遇到的数据大小各个上G,如果使用for循环一个一个执行,那真得等到猴年马月了。遂本人学习了一下Python中的多线程/多进程知识,经过一番学习找到了Python中编写并行程序的最好模式,记录如下:Python3 通过两个...
2020-04-23 23:38:13 343
原创 Hadoop学习笔记1 -大白话MapReduce
Hadoop在大数据领域可以说是元老级别的人物,无人不知无人不晓。然鹅作为Hadoop系列的开山之作,本文并不涉及Hadoop的安装配置以及基础概念,本文就利用Linux的pipe简单解释一下Hadoop中的MapReduce到底干了什么,包你一看就懂。Hadoop有四大组件:HDFS:分布式存储系统MapReduce:分布式计算系统YARN: hadoop 的资源调度系统Common...
2020-04-20 23:17:46 432
转载 make 和 make install 的区别
简单来说,make 是编译,make install 是安装。总结:linux编译安装中configure、make和make install各自的作用 ./configure是用来检测你的安装平台的目标特征的。比如它会检测你是不是有CC或GCC,并不是需要CC或GCC,它是个shell脚本。 make是用来编译的,它从Makefile中读取指令,然后编译。 make...
2020-04-07 11:39:24 1194
原创 单例模式一网打尽(C++版本)
1 什么是单例模式单例模式简单的来说就是:一个类只能有一个实例。2 C++如何实现一个单例模式呢?下面的代码就能够实现一个单例模式了~, 要点:定义构造函数为私有的 定义一个私有的static的类对象指针 定义给一个公有的static函数getInstance获取唯一一个实例化对象class Singleton {private: Singleton() {...
2020-04-05 13:54:13 272
原创 搜索引擎学习之旅3 - 搜索引擎工作流程
搜索引擎之旅系列往期文章:中文搜索引擎原理分析与实现(1)基本理论搜索引擎学习之旅1 - SEO的概念搜索引擎学习之旅2 - 搜索引擎分类前面的文章只是介绍了一些搜索引擎相关的概念,本文就介绍一下搜索引擎的完整工作流程。搜索页面的输入框是用户和搜索引擎进行交互的接口,其实这个搜索框仅仅是搜索引擎的冰山一角,可以思考一下几个问题:搜索引擎返回的数据怎么来的? 搜索引擎如何准确地...
2020-04-04 22:37:08 972
原创 搜索引擎学习之旅2 - 搜索引擎分类
搜索引擎也是可以分为很多种的,拿日常生活举例,大家经常用的Google/百度是搜索引擎,在app里最上边的搜索栏搜索商品/商店/anything else的也是搜索引擎。但是上面的搜索引擎并不是同一种,因此在本文我就梳理一下搜索引擎的种类。1 全文搜索引擎这是大家都知道的一种搜索引擎,较为典型的是百度/Google搜索引擎,全文搜索引擎也是难度最高的搜索引擎,需要使用爬虫从互联网上爬取各个...
2020-04-04 21:41:03 676
原创 面试高频问题之协程
首先复习一下什么是进程和线程:1 进程进程就是应用程序的启动实例。比如我们运行一个游戏,打开一个软件,就是开启了一个进程。进程拥有代码和打开的文件资源、数据资源、独立的内存空间 进程是操作系统进行资源分配和调度的基本单位 进程有五种状态:创建、就绪、阻塞、运行、关闭,五种状态的转换关系图为:2 线程线程从属于进程,是程序的实际执行者。一个进程至少包含一个主线程,也可以有更...
2020-04-04 21:08:04 1794
原创 搜索引擎学习之旅1 - SEO的概念
1 什么是搜索引擎我曾在研究生课程中接触过搜索引擎,当时也写了一篇搜索引擎介绍的文章中文搜索引擎原理分析与实现(1)基本理论, 想对搜索引擎有更详细的了解可以去看一下这篇文章。那么什么是搜索引擎呢?长话短说:搜索引擎本质上就是一个检索系统,为用户提供信息检索服务的。为了在海量数据中快速的找到符合用户搜索内容的结果,搜索引擎会用到倒排索引。所谓的倒排索引就是使用网页中的关键词内容作为索引的...
2020-04-04 13:39:53 608
转载 布隆过滤器(Bloom Filter)初探
布隆过滤器介绍布隆过滤器(Bloom Filter,下文简称BF)由Burton Howard Bloom在1970年提出,是一种空间效率高的概率型数据结构。它专门用来检测集合中是否存在特定的元素。听起来是很稀松平常的需求,为什么要使用BF这种数据结构呢?产生的契机回想一下,我们平常在检测集合中是否存在某元素时,都会采用比较的方法。考虑以下情况:如果集合用线性表存储,查找的时间复杂...
2020-04-03 22:37:51 421
原创 C++知识点之namespace
1 命名空间的基本概念由于不同的库可能会存在相同名称的函数,这在C的全局作用域中可能发生冲突,因此在C++中引入命名空间的概念。本质上命名空间定义了一个范围,将全局作用域划分为多个命名空间,有如下特点:不同命名空间中的标识符可以同名而不会发生冲突 命名空间可以发生嵌套 全局作用域也叫默认命名空间2 命名空间使用方式C++中命名空间使用方式有三种:使用整个命名空间:usi...
2020-04-03 13:37:09 335 1
js实现简易计时器
2018-12-29
Ubuntu16.04安装mysql的时候遇到如下问题,求解?
2018-04-27
农夫过河问题用深度优先遍历和广度优先遍历?
2016-03-08
TA创建的收藏夹 TA关注的收藏夹
TA关注的人