对BS4以及json的简单使用

最新推荐文章于 2023-01-31 17:27:57 发布

soraZ

最新推荐文章于 2023-01-31 17:27:57 发布

阅读量679

点赞数

本文链接：https://blog.csdn.net/soraZ/article/details/109641463

版权

本文介绍了如何在Python中使用BeautifulSoup4（BS4）库进行网页抓取，包括解析HTML、查找元素等基本操作。同时，也讲解了JSON数据格式的基础知识，以及如何在Python中对JSON数据进行编码和解码。通过实例，读者可以快速掌握这两个工具的基本用法。

摘要由CSDN通过智能技术生成

import csv, requests
from bs4 import BeautifulSoup
info = []
url1 = "http://bj.ganji.com/zufang/f4/pn"
headers = {
   "user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3947.100 Safari/537.36"}
for i in range(5):
    url=url1+str(i*1)
    r = requests.get(url, headers=headers)
    html = r.te