python爬虫技术 爬取链家二手房信息 保存到本地

"""
    爬取链家地址二手房信息
        目标:爬取标题名称 地址 总价

"""
import requests
import urllib.request
import urllib.parse
import re
# https://bd.lianjia.com/ershoufang/pg1/
url = "http://bd.lianjia.com/ershoufang/pg"


headers = {"User-Agent":"Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36"}

# print(L1)
# print(L2)
for j in range(100):
    urls = url + str(j)
    response = requests.get(urls, headers=headers)
    response.encoding = "utf-8"
    html = response.text
    L1 = re.findall('data-el="region">(\D+)</a>', html)
    L2 = re.findall('class="totalPrice"><span>(\d+)</span>万</div>', html)
    data1 = response.content
    for i in range(len(L1)):
        L3 = L1[i] + "  " + L2[i] + "万"+ "    "

        with open("房.txt", "a", encoding="utf-8") as f:
            f.write(L3)
            f.write("\n")



  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值