自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 爬虫xpath

Xpath常用规则表达式 描述nodename 选取此节点的所有子节点/ 从当前节点选取直接子节点// 从当前节点选取子孙节点. 选取当前节点. . 选取当前节点的父节点text() 选取文本@ 选取属性* 匹配任何元素节点@* 匹配任何属性节点node() 匹配任何类型的节点请看以下示例:表达式 描述bookstore 选取bookstore元素的所有子节点/bookstore 选取根元素 ...

2022-04-11 21:04:20 556

原创 数据库范式

1、第一范式(1NF):所谓第一范式(1NF)是指在关系模型中,对于添加的一个规范要求,所有的域都应该是原子性的,即数据库表的每一列都是不可分割的原子数据项,而不能是集合,数组,记录等非原子数据项。即实体中的某个属性有多个值时,必须拆分为不同的属性。在符合第一范式(1NF)表中的每个域值只能是实体的一个属性或一个属性的一部分。简而言之,第一范式就是无重复的域。说明:在任何一个关系数据库中,第一范式(1NF)是对关系模式的设计基本要求,一般设计中都必须满足第一范式(1NF)。不过有些关系模型中突破了1

2022-04-11 21:01:42 93

原创 Hadoop部署

第一部分:Linux环境安装Hadoop是运行在Linux,虽然借助工具也可以运行在Windows上,但是建议还是运行在Linux系统上,第一部分介绍Linux环境的安装、配置、Java JDK安装等。第二部分:Hadoop本地模式安装Hadoop本地模式只是用于本地开发调试,或者快速安装体验Hadoop,这部分做简单的介绍。第三部分:Hadoop伪分布式模式安装学习Hadoop一般是在伪分布式模式下进行。这种模式是在一台机器上各个进程上运行Hadoop的各个模块,伪分布式的意思是虽然各

2022-04-11 21:00:03 1023

原创 网络爬虫基础

作者:谢科链接:https://www.zhihu.com/question/20899988/answer/24923424来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。入门”是良好的动机,但是可能作用缓慢。如果你手里或者脑子里有一个项目,那么实践起来你会被目标驱动,而不会像学习模块一样慢慢学习。另外如果说知识体系里的每一个知识点是图里的点,依赖关系是边的话,那么这个图一定不是一个有向无环图。因为学习A的经验可以帮助你学习B。因此,你不需要学习怎么样“入门.

2022-04-03 18:51:46 70

原创 linux指令

1、ls命令就是 list 的缩写,通过 ls 命令不仅可以查看 linux 文件夹包含的文件,而且可以查看文件权限(包括目录、文件夹、文件权限)查看目录信息等等。常用参数搭配:ls -a 列出目录所有文件,包含以.开始的隐藏文件ls -A 列出除.及..的其它文件ls -r 反序排列ls -t 以文件修改时间排序ls -S 以文件大小排序ls -h 以易读大小显示ls -l 除了文件名之外,还将文件的权限、所有者、文件大小等信息详细列出来实例:(1) 按易读方式按时间反

2022-04-03 18:48:39 58

原创 sql数据库

创建数据库这样做就可以创建一个数据库:CREATE DATABASE 数据库名称创建一个表这样做就可以创建一个数据库中的表:CREATE TABLE 表名称(列名称1 数据类型,列名称2 数据类型,.......)实例本例演示如何创建名为 "Person" 的表,有四个列。列名是:"LastName"、"FirstName"、"Address" 以及 "Age":CREATE TABLE Person (LastName varchar,FirstNa

2022-04-03 18:46:01 88

原创 sql基础概要

1.SQL 语句:用关键字、表名和列名等组合而成的一条语句。  2.3 种SQL 语句种类:    (1)DDL(Data Definition Language,数据定义语言):创建、删除或修改数据库以及数据库中的表等对象。      ①CREATE:创建数据库和表等对象      ②DROP:删除数据库和表等对象      ③ALTER:修改数据库和表等对象    (2)DML(Data Manipulation Language,数据操作语言):查询或修改表中的记录。  .

2022-03-20 16:07:27 876

原创 【无标题】Linux必学的指令

 Linux必学的60个命令Linux提供了大量的命令,利用它可以有效地完成大量的工  作,如磁盘操作、文件存取、目录操作、进程管理、文件权限设定等。所以,在Linux系统上工作离不开使用系统提供的命令。要想真正理解Linux系统,  就必须从Linux命令学起,通过基础的命令学习可以进一步理解Linux系统。  不同Linux发行版的命令数量不一样,但Linux发行版本最少的命令也有200多个。这里笔者把比较重要和使用频率最多的命令,按照它们在系统中的作用分成下面六个部分一一介绍。  ◆安

2022-03-20 16:03:27 266

原创 爬虫基础学习知识

网络爬虫(英语:web crawler),也叫网络蜘蛛(spider),是一种用来自动浏览万维网的网络机器人。爬虫是一种按照一定的规则,自动地抓取万维网信息的程序或脚本。它们被广泛用于互联网搜索引擎或其他类似网站,以获取或更新这些网站的内容和检索方式。它们可以自动采集所有其能够访问到的页面内容,以供搜索引擎做进一步处理(分检整理下载的页面),而使得用户能更快的检索到他们需要的信息。从功能上来讲,爬虫一般分为数据采集,处理,储存三个部分。02爬虫的工作机制(1)上网工作机制:浏览器发出

2022-03-20 15:55:35 614

原创 数据库基础

数据库(database,DB)是指长期存储在计算机内的,有组织,可共享的数据的集合。 数据库中的数据按一定的数学模型组织、描述和存储,具有较小的冗余,较高的数据独立性和易扩展性,并可为各种用户共享。 数据库管理系统 (Database Management System)是一种操纵和管理数据库的大型软件,用于建立、使用和维护数据库,简称DBMS。...

2022-03-14 10:39:53 344

原创 【无标题】

用法1:#ls含义:列出当前工作目录下的所有文件/文件夹的名称用法2:#ls含义路劲:含义:列出指定路径,下的所有文件/文件夹的名称关于路径(重要):路径可以分为两种:相对路径、绝对路径。相对路径:相对首先得有一个参照物(一般就是当前的工作路径);相对路径的写法:在相对路径中通常会用到2个符号“./”【表示当前目录下】、“../”【上一级目录下】。绝对路径:绝对路径不需要参照物,直接从根“/”开始寻找对应路径...

2022-03-14 10:36:55 278

原创 爬虫基础—01

今天天气真好

2022-03-14 10:21:51 62

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除