自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

辛明辉的专栏

baby step

原创 centos7下安装mysql

由于centos7开始yum源里的数据库换成了MariaDB,所以我们需要手动的安装,这篇博客记录我从开始安装及遇到的问题。下载mysql的repo源wget wget http://repo.mysql.com/mysql-community-release-el7-5.noarch.rpm ...

2016-07-30 09:33:45

阅读数 208

评论数 0

原创 TCP粘包问题

在TCP协议中,每次发送数据的长度是不确定的,从接受方来看,可能每次接受到的数据都不完整,或者受到多个数据包。这就是粘包问题。 解决方式1:通过应用层的协议来解决粘包问题,每个应用包都带一个包头,包头指示了整个包的长度,当服务器端收到了指定的包长的数据包时,才说明获取了完整的数据包。 解决方式...

2016-07-28 16:18:45

阅读数 383

评论数 0

原创 codeblocks安装boost库

先说一下我的codeblocks的版本13.12 首先我们先去boost官网下载boost的源码 点击右边的download 选择你要下载的版本。 解压(可能会耗费一段时间,小文件比较多) 这里关注一个脚本文件bootstrap.bat(引导程序) 点击它(可能会等待一段时...

2016-07-28 14:46:48

阅读数 938

评论数 0

原创 找到100亿个URL中的重复URL以及搜索词汇的topK问题

有一个包含100亿个URL的文件,假设每个URL占用64B,请找出其中所有重复的URL。这类问题一种解决方案(我只想到了这一种) 将文件通过哈希函数成多个小的文件,由于哈希函数所有重复的URL只可能在同一个文件中,在每个文件中利用一个哈希表做次数统计。就能找到重复的URL。这时候要注意的就是给了...

2016-07-27 18:06:09

阅读数 6600

评论数 0

原创 visio2016企业批量授权版本的激活方式

首先先下载visio2016的企业批量授权版本。 下载地址 用window的资源管理器打开压缩包 点击setup.exe 之后默认安装接下来就是激活的过程 win + r快捷键 输入cmd cd C:\Program Files\Microsoft Office\Office16这...

2016-07-27 11:59:47

阅读数 17798

评论数 12

原创 boost asio学习笔记1--Reactor与Proactor模式

boost asio(异步输入输出) 为什么会想学习asio,起初是想了解c++的网络编程,接着去深入的了解有没有什么实用的网络库,现在网上比较流行的就是ACE, libevent和boost.asio。开始的时候去了解一下ACE,但是明显感觉这是一个重量级的网络通信库,其中有较多的设计模式。相...

2016-07-27 11:41:46

阅读数 2658

评论数 0

原创 python httplib学习笔记

httplib是一个相对底层的http请求模块,其上有专门的包装模块例如urllib内建模块。但是封装这个东西,越是封装,越不灵活。urllib模块里请求错误时就不会返回结果页的内容,只有头信息,对于某些需要进行错误请求返回值检查的场景就不适用。class httplib.HTTPConnecti...

2016-07-26 20:47:55

阅读数 211

评论数 0

原创 关于dnspython和pycharm IDE

先介绍一下pycharm。 pycharm作为python的IDE,提供了强力的debug。 你可以在官网下载pycharm的安装包 安装pycharm需要事先安装jdk pycharm为了调试接下来的问题所准备的之前我介绍了dnspython模块,由于我使用的腾讯云是centos最小化安...

2016-07-26 16:16:03

阅读数 583

评论数 0

原创 40亿个非负整数中找到没出现的数

要求这里的非负整数是32位也就是0~2^32-1。最多用1GB的内存。如果只能用10MB的空间呢,只需要找到一个没有出现的数即可。首先先分析一下,40亿个4B约为16GB这里只用1GB,这里要求注意是找出没出现,这就和网页过滤系统类似,出现与不出现两个状态(0和1),那么我们就可以用bit数组来确...

2016-07-26 11:46:03

阅读数 331

评论数 0

原创 只用2GB的内存找出20亿个整数中找到出现次数最多的数

要求有一个包含20亿个32位整数的文件,从中找到出现次数最多的数。首先先分析一下,32位int类型的数占4B,20亿个4B 约为 8GB,只用2GB肯定不够。所以我们肯定需要将这20亿个数哈希到不同的文件中,由于哈希函数的特性,对于相同的输入值,返回值也相同,所以不可能出现同一个值的数出现在不同...

2016-07-26 11:13:06

阅读数 1879

评论数 1

原创 xshell ssh连接远程服务器出现的乱码问题

首先我在使用xshell远程连接腾讯云时,出现了无法显示中文的情况。 根据以往的经验,试想了一下是否是系统没有中文的语言包。 locale -a查看当前系统所支持的字符集 发现是有中文字符集的,那我们就不需要额外的去下载。直接设置 而且还出现了在删除中文的时候出现了字符不对齐的问题...

2016-07-26 09:47:15

阅读数 2732

评论数 0

原创 win10下如何修改默认浏览器

在控制面板下的默认程序 选择第4个选项 选择自定义 将选择默认的web浏览器选择为GoogleChrome即可。 为什么不利用电脑管家的默认浏览器锁定,因为我试过没用。

2016-07-26 09:24:26

阅读数 1925

评论数 0

原创 网页黑名单系统的算法核心

通过几个题来进行阐述网页黑名单系统(有一定的容错率,有限的空间)例如不安全网页的黑名单里有100亿个数据,每一个网页的URL最多占用64B。要求实现一种过滤系统,可以根据网页的URL判断是否在这个黑名单中。系统允许有万分之一的失误率。且额外的空间不能超过30GB。首先我们分析一下100亿= 10^...

2016-07-26 00:32:30

阅读数 1901

评论数 0

原创 文件内容差异对比

difflib模块实现文件内容差异对比,difflib是python的标准库,对比文件之间差异。且支持输出可读性较强的HTML文档,与linux下的diff命令相似。difflib对比代码,配置文件的差别。 这里要介绍一个函数 splitlines() 按行进行分割,返回一个以各行内容为元素的...

2016-07-24 22:46:24

阅读数 798

评论数 0

原创 HTTP学习笔记2

在web应用中,服务器将网页传给浏览器,也就是将网页的HTML文档发送给浏览器,让浏览器显示。浏览器与服务器之间的传输协议就是HTTP协议。利用的是Chrome浏览器,按F12键进入开发者工具 Elements显示网页结构 Network显示浏览器和服务器的通信。 我们主要的操作都是在这个n...

2016-07-24 15:54:44

阅读数 168

评论数 0

原创 HTTP学习笔记

请求的3部分 请求行(请求方法 路径 协议) 头信息(格式为key:value) 空行 主体信息(可选)(要发送的内容) 例 POST /01.php HTTP/1.1 Host:localhost Content-type; application/x-www-form-url...

2016-07-24 14:31:38

阅读数 169

评论数 0

原创 SQL注入

SQL注入(SQL injection),是应用程序在数据库层的安全漏洞, 简而言之,在输入的字符串(web表单,输入域名或页面请求)中注入SQL语句,程序未设置对字符串的检测,而导致数据库服务器将该字符串认为是正确的SQL语句执行,对数据库进行入侵。原因: 1、应用程序以字符串联结的方式组...

2016-07-24 14:29:35

阅读数 180

评论数 0

原创 DNS域名轮循业务监控

我们一般的DNS解析是一个域名对应一个IP地址,但是若我们用DNS轮循技术即可将一个域名对应多个IP地址,这样可以实现简单且高效的负载平衡,但是轮循技术有一个缺点就是当目标主机不可用时,不能自动的删除,所以引出了要对业务主机的服务的可用性进行监控。具体流程是利用dnspython模块的resolv...

2016-07-24 13:38:00

阅读数 774

评论数 0

原创 python DNS处理模块dnspython

dnspython是python实现的一个DNS的工具包,可以用于查询、传输并动态 更新ZONE信息,支持TSIG(事务签名)验证消息和EDNS0(扩展DNS)。在系统管理方面,我们可以利用查询功能来实现DNS服务监控以及解析结果的校验。dnspython模块的安装 wget http://...

2016-07-22 22:50:15

阅读数 17618

评论数 0

原创 xshell5向linux服务器上传下载文件

利用 lrzsz工具 首先通过xshell登录到服务器上 rpm -qa | grep lrzsz利用此命令查看是否安装了lrzsz 如果没有任何反应则是没有安装 若没有安装 yum install lrzsz安装 之后输入 rz 弹出以上窗口选择上传文件 上传的文件的路径在输入...

2016-07-20 12:00:09

阅读数 7002

评论数 0

原创 python之IP地址处理模块IPy

IPy的安装 wget https://pypi.python.org/packages/source/I/IPy/IPy-0.81.tar.gz tar -xzvf IPy-0.81.tar.gz cd IPy-0.81 python setup.py install IP地址与网段的...

2016-07-20 10:32:39

阅读数 1311

评论数 0

原创 centos 7 下的python psutil模块

psutil(process and system utilities) 我的python版本是2.7.5 python中的psutil模块是系统性能信息模块 接下来我来介绍如何在centos7下源码安装psutil wget http://pypi.python.org/packages...

2016-07-19 21:23:47

阅读数 1379

评论数 0

原创 ubuntu安装后进行的一些操作

我一般在安装完ubuntu后第一件事就是设置root密码 sudo passwd 后输入用户密码,接着是root密码,重复root密码 第二件就是在system setting 中的language support 中添加中文 一般进入language support中它就会自动提示你进行...

2016-07-11 12:55:26

阅读数 272

评论数 0

原创 文章标题

boost库关于获取配置选项需要你连接libboost_program_options库。我的环境是Ubuntu15.04需要安装boost,sudo apt-get install libboost-dev,需要boost_program_options库的时候,需要sudo apt-get i...

2016-07-11 12:44:28

阅读数 203

评论数 0

提示
确定要删除当前文章?
取消 删除