【学习记录】Scrapy爬取豆瓣数据储存到MySQL库中（数据遗漏问题待解决）

最新推荐文章于 2021-04-23 18:19:10 发布

VIP文章 YuY_锦鲤

最新推荐文章于 2021-04-23 18:19:10 发布

阅读量443

点赞数

分类专栏： Python知识记 MySQL 文章标签： python mysql 数据库 sql

本文链接：https://blog.csdn.net/weixin_45645036/article/details/108329932

版权

Windows 10 系统，Python 3.7
爬取豆瓣读书top250所有的书名，作者，评分，简介，将数据保存至MySQL库中。
网址链接：https://book.douban.com/top250

待解决问题：数据爬取有缺失，只爬取到了187组数据

一、创建数据库及数据表

1、创建数据库：

create database douban charset=utf8;

2、在数据库下创建数据表：

create table douban_top250(
	id int unsigned auto_increment primary key not null,
	name varchar(100),
	author varchar(50),
	score varchar(3),
	introduction text,
	is_delete bit not null default 0
	);

二、创建scrapy项目

在本地终端打开你想创建项目的文件夹，输入命令行：

scrapy startproject douban_read

1、定义item

import scrapy

class DoubanReadItem(scrapy.Item):
    # 书名
    name = scrapy.Field(

最低0.47元/天解锁文章

YuY_锦鲤

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【学习记录】Scrapy爬取豆瓣数据储存到MySQL库中（数据遗漏问题待解决）

Windows 10 系统，Python 3.7爬取豆瓣读书top250所有的书名，作者，评分，简介，将数据保存至MySQL库中。网址链接：https://book.douban.com/top250待解决问题：数据爬取有缺失，只爬取到了187组数据目录一、创建数据库及数据表1、创建数据库：2、在数据库下创建数据库：二、创建scrapy项目1、定义item2、爬虫spider3、pipelines 数据存储4、settings设置5、运行结果一、创建数据库及数据表1、创建数据库：creat
复制链接

扫一扫