爬虫-BeautifulSoup-蛋壳公寓租房

import re,requests
from bs4 import BeautifulSoup


def get_page_info(page=1):
    url="https://www.danke.com/room/sh?page="+str(page)
    headers={
        "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36",
        "Referer":"https://www.danke.com/sh"
    }
    r=requests.get(url,headers=headers)
    soup=BeautifulSoup(r.text,'html.parser')
    house_list=soup.find_all("div",attrs={"class":"r_lbx"})
    for once in house_list:
        house_name=once.find("div",attrs={"class":"r_lbx_cena"}).a.attrs['title']
        house_url=once.find("div",attrs={"class":"r_lbx_cena"}).a.attrs['href']
        house_price=once.find("span",attrs={"class":"ty_b"}).text.strip()
        house_station_info=once.find("div",attrs={"class","sub_img"}).next_element.strip()
        house_info4=once.find(text=re.compile("㎡"))
        house_info4=re.sub("\s",'',house_info4)
        try:
            house_discount=once.find("div",attrs={"class":"new-price-link"}).text
            house_discount=re.sub("\s",'',house_discount)[:-2]
        except AttributeError :
            house_discount="暂无优惠"
        print(house_discount)

for page in range(1,5):
    get_page_info(page)


# import re
#
# str1="距5号环中线,10号线五和站400米"
# str2="距3号龙岗线六约站250米"
# str3="距1号罗宝线,3号龙岗线购物公园站850米"
# str4="距2号蛇口线,9号线景田站500米"
# str5="距9号线香梅站200米"
# regex="距(?:(\d+)号([\u4e00-\u9fa5]*)线,)?(\d+)号([\u4e00-\u9fa5]*)线([\u4e00-\u9fa5]*)站(\d+)米"
# print(re.search(regex,str1).groups())
# print(re.search(regex,str2).groups())
# print(re.search(regex,str3).groups())
# print(re.search(regex,str4).groups())
# print(re.search(regex,str5).groups())

C:\Anaconda3\python.exe D:/AI/01-AI基础/AI-3-Python高级/01爬虫PPT/day3_lxml和动态请求/demo1-蛋壳公寓BeautifulSoup.py
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠
暂无优惠

Process finished with exit code 0

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值