本办法是最基础也是在爬取链家数据中最容易上手的代码
# 需要先安装并导入requests和bs4两个库,re是python自带,可以直接导入
import requests
from bs4 import BeautifulSoup
import re
# 链家的二手房基础页面只显示最多100页,每页30个房源的数据,也就是用这个办法,最多可以拿到3000家房源的数据
page = 2 # 用于定义页数
# 先打开一个csv文件,定义好标题,以备数据插入
with open(r'c:\lianjia.csv','a') as f:
f.write('{},{},{},{},{},{},{},{},{},{},{},{},\n'.format('房源编号','小区','商圈','户型','面积','朝向','户型','装修','年代','总价','单价','标题'))
for i in range(1,page):
<