自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 网络爬虫正确的表达方式

1.了解正则表达式正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。...

2022-03-21 11:38:54 47

原创 linux

基础指令1.pwd指令用法:pwd(printworkingdirectory,打印当前工作目录)2、cd指令命令:cd(changedirectory,改变目录)作用:用于切换当前的工作目录的语法:cd 路径3、mkdir指令指令:mkdir(makedirectory,创建目录)语法1:#mkdir路径【路径,可以是文件夹名称也可以是包含名称的一个完整路径】注意:ls列出的结果颜色说明,其中蓝色的名称表示文件夹,黑色的表示文件,绿色的其权限为拥有所有权限语法2:#mkdi

2022-03-21 11:36:51 795

原创 MySQL数据类型

MySQL数据类型MySQL中定义数据字段的类型对你数据库的优化是非常重要的。MySQL支持多种数值类型MySQL支持所有标准SQL数值数据类型。这些类型包括严格数值数据类型(INTEGER、SMALLINT、DECIMAL和NUMERIC),以及近似数值数据类型(FLOAT、REAL和DOUBLEPRECISION)。关键字INT是INTEGER的同义词,关键字DEC是DECIMAL的同义词。BIT数据类型保存位字段值,并且支持MyISAM、MEMORY、InnoDB和BDB表。作为SQL标准的

2022-03-21 11:35:57 848

原创 PYTHON网络爬虫大数据朱炯明

Python 爬虫架构Python 爬虫架构主要由五个部分组成,分别是调度器、URL管理器、网页下载器、网页解析器、应用程序(爬取的有价值数据)。调度器:相当于一台电脑的CPU,主要负责调度URL管理器、下载器、解析器之间的协调工作。URL管理器:包括待爬取的URL地址和已爬取的URL地址,防止重复抓取URL和循环抓取URL,实现URL管理器主要用三种方式,通过内存、数据库、缓存数据库来实现。网页下载器:通过传入一个URL地址来下载网页,将网页转换成一个字符串,网页下载器有urllib2(Py

2022-03-13 22:14:31 144

原创 LINUX基础指令大数据朱炯明

基础指令1、ls指令含义:ls (list)用法1:#ls含义:列出当前工作目录下的所有文件/文件夹的名称用法2:#ls 路径含义:列出指定路径下的所有文件/文件夹的名称关于路径(重要):路径可以分为两种:相对路径、绝对路径。相对路径:相对首先得有一个参照物(一般就是当前的工作路径); 相对路径的写法:在相对路径中通常会用到2个符号“./”【表示当前目录下】、“../”【上一级目录下】。绝对路径:绝对路径不需要参照物,直接从根“/”开始寻找对应路径;...

2022-03-13 22:13:08 84

原创 SQL数据库大数据朱炯明

#建库语法: CREATE DATABASE IF NOT EXISTS 库名 DEFAULT CHARSET 编码格式;CREATE DATABASE IF NOT EXISTS yuesu DEFAULT CHARSET utf8;#使用库语法: USE 库名USE yuesu#建表语法: CREATE TABLE IF NOT EXISTS 表名( 字段名1 数据类型 主键 自增, 字段名2 数据类型(长度) 非空 唯一 默认值 备注,...

2022-03-13 22:10:39 51

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除