链家二手房100页Xpath爬取保存csv

最新推荐文章于 2024-05-07 20:50:30 发布

满天星☞

最新推荐文章于 2024-05-07 20:50:30 发布

阅读量406

点赞数

分类专栏： python 网络爬虫 xpath

本文链接：https://blog.csdn.net/sunjiaxing_1/article/details/118274155

版权

import random
import time
import csv
import requests
from fake_useragent import UserAgent
from lxml import etree


class House:
    def __init__(self):
        self.url = 'https://bj.lianjia.com/ershoufang/pg{}/'
        self.f = open('链家100.csv','w')
        self.write = csv.writer(self.f)

    def get_html(self, url):
        headers = {
   'UserAgent': UserAgent().random}
        html = requests.get(url=url, headers=headers).text
        self.parser_html(html)

    def parser_html(self, html):
        eobj = etree.HTML(html)
        li_list = eobj.xpath("//li[@class='clear LOGVIEWDATA LOGCLICKDATA']")
        for li in

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

满天星☞

关注关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
链家二手房100页Xpath爬取保存csv

import randomimport timeimport csvimport requestsfrom fake_useragent import UserAgentfrom lxml import etreeclass House: def __init__(self): self.url = 'https://bj.lianjia.com/ershoufang/pg{}/' self.f = open('链家100.csv','w')
复制链接

扫一扫