简单做了个脚本,将房源写入json文件
代码注释很全,不做解释了。
import json
from urllib import request,parse
import re
from lxml import etree
from bs4 import BeautifulSoup,element
def get_url():
"""
处理url地址
:param url: 初始url模板
:param headers: 请求头
:return: None
"""
page = int(input('请输入页数:'))
for i in range(1,page+1):
url = 'https://bj.fang.anjuke.com/loupan/all/p{}/'.format(i)
# 执行解析
parse(url,headers,i)
def parse