Python爬虫、数据清洗与可视化-2 -request-练习-2-——豆瓣读书_python3爬虫数据清洗与可视化实战课后习题答案-CSDN博客

本文链接：https://blog.csdn.net/m0_56267896/article/details/115428017

面向过程是分析出解决问题所需要的步骤，然后用函数把这些步骤一步一步实现，使用的时候一个一个依次调用就可以了。
面向对象是把构成问题事务分解成各个对象，建立对象的目的不是为了完成一个步骤，而是为了描叙某个事物在整个解决问题的步骤中的行为。
例如五子棋，
面向过程的设计思路：分析问题的步骤，解决问题：
1、开始游戏，2、黑子先走，3、绘制画面，4、判断输赢，5、轮到白子，6、绘制画面，7、判断输赢，8、返回步骤2，9、输出最后结果。把上面每个步骤用分别的函数来实现，问题就解决了。
面向对象的设计思路：问题分解分类。
整个五子棋可以分为：1、黑白双方，这两方的行为是一模一样的，2、棋盘系统，负责绘制画面，3、规则系统，负责判定诸如犯规、输赢等。

方法一：使用面向过程爬取1.0

import json
import requests
from lxml import etree

url = "https://www.douban.com/doulist/1264675/?start=0"
response = requests.get(url).content.decode()
dom = etree.HTML(response)
books = dom.xpath('//div[@class="article"]/div[@class="doulist-item"]')
with open('book.json', 'w', encoding='utf-8')as f:
    for book in books:
        item = {
   }
        item['title'] = book.xpath('normalize-space(.//div/div[2]/div[3]/a/text())')
        item['author'] = book.xpath('normalize-space(.//div/div[2]/div[5]/text()[1])')
        item['year'] = book.xpath('normalize-space(.//div/div[2]/div[5]/text()[3])')
        item['rank'] = book.xpath('normalize-space(.//div/div[2]/div[4]/span[@class="rating_nums"]/text())')
        f.write(json.dumps(item, ensure_ascii=False) + ',\n')