自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 Python爬虫之爬取起点中文网

11

2019-05-21 22:34:10 6130

原创 shell基础知识

shell基础知识1.shell简介shell是系统跟计算机硬件交互时使用的中间介质,它只是系统的一个工具。在shell和计算机硬件还有一层东西那就是–系统内核,系统内核在系统中就像大脑至于人类一样的作用,shell则更像是人类的五官。用户直接面对的不是计算机硬件而是shell,用户把指令告诉shell,然后shell再传输给系统内核,接着内核再去支配计算机硬件去执行各种操作centOS...

2019-02-25 22:01:36 191

原创 Linux下安装RPM包或源码包

Linux下安装RPM包或源码包1.简介:在windows下安装软件很简单,只要双击后缀为.exe的文件,然后在根据安装界面引导进行安装即可。但在Linux下由于我们并不是直接在图形化界面进行操作的,所以就没那么容易了yum命令是Red Hat所特有的安装RPM程序包的工具。使用RPM工具安装某一个程序包时,有可能会因为该程序包依赖另一个程序包而无法安装:而使用yum工具时,就可以连同依赖的...

2019-02-24 21:12:59 1017

原创 Linux下的文档压缩与打包

Linux下的文档压缩和打包1. 简介:在windows下的我们接触最多的压缩文件是 .rar 格式的;但在Linux下却并不能识别这种格式,它有自己独特的压缩工具。但 .zip 格式的文件在两种操作系统下都能使用。使用压缩文件不仅能节省磁盘空间,而且在传输时还能节省网络带宽。Linux下最常见的压缩文件通常都是.tar.gz格式的。除此之外,还有.tar,.gz,.bz2,.zip等格式...

2019-02-15 13:48:34 335

原创 Linux文本编辑工具Vim

Linux文本编辑工具Vim

2019-02-04 20:22:06 166

原创 Linux磁盘管理

LInux磁盘管理需求:监控磁盘的使用率在日常监控中是必须要做的,磁盘被写满是很要命的,严重的情况会导致磁盘损坏。1.查看磁盘或者目录的容量1.df用处: 用于查看已挂载磁盘的总容量,使用容量,剩余容量等,默认以KB为单位显示/boot是我们安装系统时划分出来的。/dev, /dev/shm为内存分区,默认大小为内存大小的1/2,如果文件处于这几个分区下,则好处...

2019-02-02 16:28:23 733

原创 Linux系统用户与用户组管理

Linux系统用户与用户组管理1./etc/passwd 文件该文件分割成7个字段:第一个字段:为用户名,是代表用户的账号的字符串第二个字段:为该账号的口令,这里用x代替,真正的口令存在于/etc/shadow中第三个字段:为用户标识号(uid),系统就是通过这个识别用户身份的uid取值范围:0~65536,uid为0代表为root用户,centos7的普通用户表示号从10...

2019-01-26 20:58:59 370 2

原创 Linux文件类型

linux文件类型1.常见文件类型1.普通文件:定义:即一般类型的文件,当用命令ls -l查看某个目录时,第一个属性为‘-’的文件就是普通文件分类:纯文本文件(ASCII),可通过cat,more,less等工具直接查看内容,二进制文件不能二进制文件(binary),如/usr/bin/ls命令就是一个二进制文件2.目录:定义:与windows下的文件夹类似,只...

2019-01-22 12:24:23 1056

原创 linux文件和目录管理

Linux文件和目录管理1. 绝对路径和相对路径绝对路径:路径的写法一定是从根目录 / 写起的如:/usr/local/mysql相对路径:路径的写法不是由根目录 / 写起的如:1. # cd /home 2. # cd test用户先进入到home,在进入到test,此时的test是相对于/home来说的,所以称为相对目录1.2. cd用处:是用来变更用户所在目...

2019-01-21 21:36:38 273

原创 Python数据结构之栈结构

1. 什么是栈栈(有时称为“后进先出栈”)是一个项的有序集合,其中添加移除新项总发生在同一端。这一端 通常称为“顶部”。与顶部对应的端称为“底部”。栈的底部很重要,因为在栈中靠近底部的项是存储时间最长的。最近添加的项是最先会被移除的。这种排序原则有时被称为 LIFO,后进先出。它基于在集合内的时间长度做排序。较新的项靠近顶部,较旧的项靠近底部。python中对象在栈中的进出顺序,如Fig...

2018-11-06 10:03:42 181

原创 python爬虫之代理池的维护

代理池的维护1.原因:网上有大量公开的免费代理和付费代理,但无论是哪种代理,我们都不能保证是可用的,因为可能有各种原因导致代理不可用,这肯定会影响爬虫的效率,所以我们需要提前做筛选,将不可用的代理删除掉,保留可用代理,所以我们需要搭建一个高效的代理池2代理池基本模架构:存储模块:负责存储抓取下来的代理,保证代理不重复,标识代理的可用情况,动态实时处理每个代理,采用Redis的Sorte...

2018-10-27 14:02:22 1183

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除