欢迎来到python爬虫大讲堂,现在开始你的爬虫旅程吧!
存储到MySQL
MySQL是一种关系式数据库,使用SQL语言,MySQL将数据保存到不同表中,而不是将数据存放在一个大仓库里,因此比较灵活flexible。
MySQL安装
- 进入mysql官网下载页面:https://dev.mysql.com/downloads/mysql/,进入msi下载页面(点击Go to Download Page):
- 下载文件较大的那个msi文件,下载时间可能较长:
- 点开安装页面,选择custom安装,其中MySQL Servers必须安装,workbench是图形化操作界面,其它可以自己定制
- 选好了点击next-execute
- 接下来选择develop machine,点击next
- 在password框中输入你想要的密码,点击ok
- 接下来就安装完毕
因为我已经安装完毕,所以没有图片,敬请谅解!
安装完成后我们打开WorkBench:
点击local instance MySQL80,输入你的密码,接下来我们开始学习mysql的基本操作:
创建数据库
首先创建一个数据库,输入:
CREATE DATABASE scraping;
接下来使用这个数据库:
USE scraping
创建表格
现在我们在数据库中创建数据表:
CREATE TABLE urls{
id INT NOT NULL AUTO_INCREMENT,
url VARCHAR(300) NOT NULL,
need VARCHAR(500) NOT NULL,
PRIMARY KEY(id)
};
在这个数据表中,我们创建了id,url,need三个,id是整数,NOT NULL代表不能为空,AUTO_INCREMENT代表自动增长,一般将id作为主键(PRIMARY KEY)
url和need中的VARCHAR代表最长的长度,VARCHAR(100)就代表最长长度为100。
接下来查看数据表结构:
DESCRIBE urls;
插入数据
插入一些数据:
INSERT INTO urls(url,need) VALUES ('www.baidu.com','requests');
id为自动增加,所以不用手动添加。
提取数据
提取id为1的数据:
SELECT * FROM urls WHERE id=1;
*代表所有数据,加入我们只要看need:
SELECT need FROM urls WHERE id=1;
包含部分内容的选取:
SELECT * FROM urls WHERE need LIKE '%re%';
删除数据
删除一行数据:
DELETE FROM urls WHERE id=1;
删除表中所有数据:
truncate table urls;
修改数据
首先插入:
INSERT INTO urls(url,need) VALUES ('www.baidu.com','requests');
现在修改:
UPDATE urls SET url='www.google.com',content='selenium' WHERE id =2;
如果想了解更多,可以参见:http://www.runoob.com/mysql/mysql-tutorial.html
下次见!