深圳房产信息爬取

最新推荐文章于 2021-03-31 14:43:14 发布

mo8808

最新推荐文章于 2021-03-31 14:43:14 发布

阅读量337

点赞数

文章标签：爬虫

本文链接：https://blog.csdn.net/mo8808/article/details/101616713

版权

from selenium import webdriver
import time

driver = webdriver.Firefox(executable_path = r'C:\Users\mok9697m\Desktop\geckodriver.exe')
#把上述地址改成你电脑中geckodriver.exe程序的地址
for i in range(0,3):
    link = "https://zh.airbnb.com/s/Shenzhen--China/homes?items_offset=" + str(i *18)
    driver.get(link)
    time.sleep(5)
    rent_list = driver.find_elements_by_css_selector('div._gig1e7')

    for eachhouse in rent_list:
        try:
            comment = eachhouse.find_element_by_css_selector('div._qhtkbey').text
        except:
            comment = 0
        price = eachhouse.find_element_by_css_selector('div._1ovgt1s0>div._1ixtnfc>span:nth-child(2)')
        price = price.text.replace("每晚", "").replace("价格", "").replace("\n", "")
     
        details = eachhouse.find_element_by_css_selector('span._fk7kh10')
        details = details.text
        house_type = details.split(" · ")[0]
        bed_number = details.split(" · ")[1]
       
        print (comment,price,house_type,bed_number)
    time.sleep(5)
 #price = eachhouse.find_element_by_css_selector('div._1yarz4r')
       # price = price.text.replace("每晚", "").replace("价格", "").replace("\n", "")
        #name = eachhouse.find_element_by_css_selector('div._vbshb6')
       # name = name.text
        #details = eachhouse.find_element_by_css_selector('span._14ksqu3j')
        #details = details.text
       # house_type = details.split(" · ")[0]
       # bed_number = details.split(" · ")[1]
        #print (comment, price, name, house_type, bed_number)

mo8808

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深圳房产信息爬取

from selenium import webdriverimport timedriver = webdriver.Firefox(executable_path = r'C:\Users\mok9697m\Desktop\geckodriver.exe')#把上述地址改成你电脑中geckodriver.exe程序的地址for i in range(0,3): link =...
复制链接

扫一扫