自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 Scrapy 框架

Scrapy 是一个基于 Twisted 的异步处理框架,是纯 Python 实现的开源爬虫框架,其架构清晰,模块之间的耦合程度低,可扩展性极强,可以灵活完成各种需求。自定义 Item Pipeline 很简单,每个 Item Pipeline 组件都是一个独立的 Python 类,该类中的 process_item 方法必须实现,每个 Item Pipeline 组件都需要调用 process_item 方法。

2023-06-12 19:53:42 2675

原创 Linux 平均负载

状态(Uninterruptible Sleep,也成为 Disk Sleep)的进程。比如,当一个进程向磁盘读写数据时,为了保证数据的一致性,在得到磁盘恢复前,它是不能被其他进程或者中断打断的,这个时候的进程就处于不可中断状态。如果此时的进程被打断了,就容易出现磁盘数据与进程数据不一致的问题。不可中断状态的进程则是正处于内核态关键流程中的进程,并且这些流程是不可打断的,比如最常见的是等待硬件设备 IO 响应,也就是在使用。可运行状态的进程,是指正在使用 CPU 或者正在等待 CPU 的进程,也就是用。

2023-05-29 15:52:07 113

原创 requests 库的使用

Python requests 是一个常用的 HTTP 请求库,可以方便地向网站发送 HTTP 请求,并获取响应结果。requests 模块比 urllib 模块更简洁。

2023-05-28 22:30:39 268

原创 Linux CPU 使用率

为了维护 CPU 时间,Linux 通过事先定义的节拍率(内核中表示为 HZ),触发时间中断,并使用全局变量 Jiffies 记录开机以来的节拍数。其中第一列表示的是 CPU 编号,而第一行没有编号的 cpu,表示的是所有 CPU 的累加,其他列则表示不同场景下 CPU 的累加节拍数,它的单位是。Linux 作为一个多任务操作系统,将每个 CPU 的时间划分为很短的时间片,再通过调度器轮流分配各个任务使用,因此造成多任务同时运行的错觉。不同的系统可能设置不同的数值,可以通过查询。内核选项来查看它的配置值。

2023-05-28 14:58:43 810

原创 使用VSFTPD服务传输文件

什么是FTPFTP(File Transfer Protocol)是一种在互联网中进行文件传输的协议,基于客户端/服务器模式,默认使用20、21号端口,其中端口20(数据端口)用于进行数据传输,端口21(命令端口)用于接受客户端发出的相关FTP命令与参数。FTP服务器普遍部署于内网中,具有容易搭建、方便管理的特点。FTP服务器是按照FTP协议在互联网上提供文件储存和访问服务的主机,FTP客户端则是向服务器发送连接请求,以建立数据传输的链路。FTP协议有下面两种工作模式。(1)主动模式:FTP服务器主动

2020-11-03 21:03:45 308

原创 使用DHCP动态管理主机地址

什么是DHCP动态主机配置协议(DHCP,Dynamic Host Configuration Protocol),该协议用于自动管理局域网内主机的IP地址、子网掩码、网关地址及DNS地址等参数,可以有效地提升IP地址的利用率,提高配置效率,并降低管理与维护成本。DHCP常见术语(1)作用域:一个完整的IP地址段,DHCP协议根据作用域来管理网络的分布、分配IP地址及其他配置参数。(2)超级作用域:用于管理处于同一个物理网络中的多个逻辑子网段。超级作用于中包含了可以统一管理的作用域列表。(3)排除

2020-10-25 01:56:57 752

原创 将 Kali v.2020_2 x64 GNOME 3 桌面上的Top Bar 移到底部

安装 GNOME 3 扩展sudo apt-get install gnome-shell-extension-dash-to-panel重新登录使用 GNOME 3 扩展gnome-shell-extension-prefs将弹出来的选项卡中的 Dash to Panel 的状态从 off 变为 on更多 GNOME 3 扩展,可以参考原文...

2020-06-08 11:24:38 834

原创 在 CentOS v.6_5 i386 上安装 mysql v.5_7_17

下载 mysql 安装包yum install wget -ywget https://cdn.mysql.com//archives/mysql-5.7/mysql-5.7.17-linux-glibc2.5-i686.tar.gz安装 libaio 依赖库yum install libaio安装 mysqlgroupadd mysqluseradd -r -g mysql -s /bin/false mysqltar xzvf mysql-5.7.17-linux-gli.

2020-06-04 15:19:55 153

原创 在 Kali v.2002_2 x64 上安装 VMware Workstation/Player v.15

下载 VMware Workstation/Player# 下载最新版的 VMware Workstationcurl -L https://www.vmware.com/go/getworkstation-linux > vmware.bin# 下载最新版的 VMware Playercurl -L https://www.vmware.com/go/getplayer-linux > vmware.bin安装 VMware Workstation/Playersudo .

2020-06-04 00:07:21 202

原创 在 Ubuntu v.14_04 x64 上安装 TeamViewer v.15

岁末年初,一场新冠肺炎疫情突袭大江南北。经过全国人民团结一心、众志成城的不懈努力,全国疫情防控狙击取得了重大的胜利。

2020-05-20 10:03:18 535

原创 爬虫基本原理

简单来说,爬虫就是获取网页并提取和保存信息的自动化程序。

2020-03-22 00:31:35 244

原创 Web网页基础

不同类型的元素通过不同类型的标签来表示,如图片用img标签表示,视频用video标签表示,段落用p标签表示,它们之间的布局又常通过布局标签div嵌套组合而成,各种标签通过不同的排列和嵌套就可以形成网页的框架。虽然HTML定义了网页的结构,但是只有HTML页面的布局并并不美观,为了让网页看起来更好看一些,这里就需要借助CSS了。综上所书,HTML定义了网页的内容和结构,CSS描述了网页的布局,JavaScript定义了网页的行为。CSS是目前唯一的网页页面排版样式标准,有了它的帮助,页面才能更加的美观。

2020-03-04 18:20:33 484 1

原创 HTTP基本原理

在百度、淘宝等大型网站的首页中,URL的开头都会由http或https,这个就是访问资源需要的协议类型,有时候我们还会看到ftp、sftp、smb开头的URL,这里的ftp、sftp、smb也都是指协议类型。超文本,其英文名称为Hypertext,我们在浏览器里看到的网页就是超文本解析而成的,其网页源代码是一系列的HTML代码,里面包含了一系列标签,比如img显示图片,p指定显示段落等等。在爬虫中,我们可以根据状态码来判断服务器的响应状态,如状态码200,则证明成功返回数据,在进一步的处理,否则直接忽略。

2020-03-04 14:23:51 414 1

原创 检测某工程下的源文件是否发生过修改并且找出具体的源文件

#!/bin/bash# 注意事项,执行该脚本前应首先声称文件的数字签名日志文件,即md5.log# 可以使用命令:ls *.c | xargs md5sum > md5.logif [ ! -f diff.log ]; then # 生成文件的数字签名 $(ls *.c | xargs md5sum > temp.log) # 对比文件的数字签名是否发生改变 $(dif...

2020-02-03 03:01:52 223

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除