python3爬虫豆瓣top250图书（并保存到mysql数据库）

最新推荐文章于 2020-10-10 12:48:50 发布

「已注销」

最新推荐文章于 2020-10-10 12:48:50 发布

阅读量1.5k

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/easy_purple/article/details/82725140

版权

本文介绍了使用Python3进行网络爬虫，抓取豆瓣Top250图书信息，并详细讲解如何将数据保存到MySQL数据库的过程。

摘要由CSDN通过智能技术生成

参考上篇文章

附上代码：

import requests
from bs4 import BeautifulSoup
import mysql.connector


def get_pages_link():
    # 插入到数据库
    conn = mysql.connector.connect(user='root', password='root', database='test')
    cursor = conn.cursor()

    header = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.92 Safari/537.36',
        'Connection': 'keep-alive'
    }

    for item in range(0, 250, 25):
        url = "https://book.douban.com/top250?start={}".format(item)
        web_data = requests.get(url, headers=header)
        soup = BeautifulSoup(web_data.content, 'lxml')
        for movie in soup.select('.item'):
            href = movie.find('a')["href"]
            name = movie.get_text().strip()[:20].strip()  # 片名

最低0.47元/天解锁文章

「已注销」

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
python3爬虫豆瓣top250图书（并保存到mysql数据库）

参考上篇文章附上代码：import requestsfrom bs4 import BeautifulSoupimport mysql.connectordef get_pages_link(): # 插入到数据库 conn = mysql.connector.connect(user='root', password='root', database='tes...
复制链接

扫一扫

专栏目录