爬取广州链家二手房并写入csv

最新推荐文章于 2023-01-08 16:11:46 发布

Hello_Jandy

最新推荐文章于 2023-01-08 16:11:46 发布

阅读量1.5k

点赞数

分类专栏：爬虫

本文链接：https://blog.csdn.net/weixin_42141853/article/details/80946323

版权

知识点：多线程，读取csv,xpath

import json
import csv
import requests
import threading
import lxml
import lxml.etree

#递归锁
rLock=threading.RLock()

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:43.0) Gecko/20100101 Firefox/43.0'}

#获取区域
def getAreaList(url):
    html=requests.get(url,headers=headers).text
    mytree=lxml.etree.HTML(html)
    areList=mytree.xpath('//div[@data-role="ershoufang"]//a')
    areaDict={}
    for area in areList:
        # 区域名
        areaName=area.xpath('./text()')[0]
        #url
        areaUrl = 'https://gz.lianjia.com'+area.xpath('./@href')[0]
        #print(areaName,areaUrl)
        areaDict[areaName]=areaUrl
        print(areaName,areaUrl)
    return areaDict


#获取区域页数
def getAreaPage(areaUrl,areaName):
    html = requests.get(are

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Hello_Jandy

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
爬取广州链家二手房并写入csv

知识点：多线程，读取csv,xpathimport jsonimport csvimport requestsimport threadingimport lxmlimport lxml.etree#递归锁rLock=threading.RLock()headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW6...
复制链接

扫一扫