python爬虫教程（8）-数据存储之MySQL

最新推荐文章于 2021-08-22 23:04:58 发布

Ejasmine

最新推荐文章于 2021-08-22 23:04:58 发布

阅读量735

点赞数 3

分类专栏： python入门爬虫教程 python爬虫教程从入门到精通文章标签： python 网络爬虫 MySQL 数据存储

本文链接：https://blog.csdn.net/weixin_42183408/article/details/87526050

版权

16 篇文章 2 订阅

订阅专栏

11 篇文章 3 订阅

订阅专栏

欢迎来到python爬虫大讲堂，现在开始你的爬虫旅程吧！

MySQL是一种关系式数据库，使用SQL语言，MySQL将数据保存到不同表中，而不是将数据存放在一个大仓库里，因此比较灵活flexible。

进入mysql官网下载页面：https://dev.mysql.com/downloads/mysql/，进入msi下载页面（点击Go to Download Page）：
下载文件较大的那个msi文件，下载时间可能较长：
点开安装页面，选择custom安装，其中MySQL Servers必须安装，workbench是图形化操作界面，其它可以自己定制
选好了点击next-execute
接下来选择develop machine，点击next
在password框中输入你想要的密码，点击ok
接下来就安装完毕

因为我已经安装完毕，所以没有图片，敬请谅解！

安装完成后我们打开WorkBench：
在这里插入图片描述
点击local instance MySQL80，输入你的密码，接下来我们开始学习mysql的基本操作：

首先创建一个数据库，输入：

CREATE DATABASE scraping;

接下来使用这个数据库：

USE scraping

现在我们在数据库中创建数据表：

CREATE TABLE urls{
id INT NOT NULL AUTO_INCREMENT,
url VARCHAR(300) NOT NULL,
need VARCHAR(500) NOT NULL,
PRIMARY KEY(id)
};

在这个数据表中，我们创建了id，url，need三个，id是整数，NOT NULL代表不能为空，AUTO_INCREMENT代表自动增长，一般将id作为主键（PRIMARY KEY)

url和need中的VARCHAR代表最长的长度,VARCHAR(100)就代表最长长度为100。

接下来查看数据表结构：

DESCRIBE urls;

插入一些数据：

INSERT INTO urls(url,need) VALUES ('www.baidu.com','requests');

id为自动增加，所以不用手动添加。

提取id为1的数据：

SELECT * FROM urls WHERE id=1;

*代表所有数据，加入我们只要看need：

SELECT need FROM urls WHERE id=1;

包含部分内容的选取：

SELECT * FROM urls WHERE need LIKE '%re%';

删除一行数据：

DELETE FROM urls WHERE id=1;

删除表中所有数据：

truncate table urls;

首先插入：

INSERT INTO urls(url,need) VALUES ('www.baidu.com','requests');

现在修改：

UPDATE urls SET url='www.google.com',content='selenium' WHERE id =2;

下次见！