day01爬虫作业

最新推荐文章于 2024-05-18 21:47:28 发布

朕许你此生称心如意！

最新推荐文章于 2024-05-18 21:47:28 发布

阅读量321

点赞数

文章标签：爬虫 python 数据挖掘

本文链接：https://blog.csdn.net/qq_44981522/article/details/122421158

版权

day01爬虫作业

爬取贝壳100页房源信息并存入csv文件

def data_home(str_data=str):
    # 1. 获取网页数据
    response = requests.get(f'https://cd.zu.ke.com/zufang{str_data}/#contentList')
    # 2. 解析网页数据
    soup = BeautifulSoup(response.text, 'lxml')
    all_house = soup.select('.content__list>.content__list--item')
    data = []
    for house in all_house:
        # 名字
        name = house.select_one('.twoline').text.strip()
        # 价格
        price = house.select_one('.content__list--item-price').text

        # 地址-面积-户型
        p = house.select_one('.content__list--item--des')
        message = sub(r'\s+', '', p.text)
        data.append([name, price, message])
    writer = csv.writer(open('files/home_data.csv', 'a', newline='', encoding='utf-8'))
    if str_data=='':
        writer.writerow(['户型朝向', '房租', '地址面积'])
    writer.writerows(data)


str1 = '/pg'
if __name__ == '__main__':
    for x in range(1, 101):
        time.sleep(1)
        if x == 1:
            data_home(str_data='')
        else:
            str_data = str1 + str(x)

            data_home(str_data)

朕许你此生称心如意！

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
day01爬虫作业

day01爬虫作业爬取贝壳100页房源信息并存入csv文件def data_home(str_data=str): # 1. 获取网页数据 response = requests.get(f'https://cd.zu.ke.com/zufang{str_data}/#contentList') # 2. 解析网页数据 soup = BeautifulSoup(response.text, 'lxml') all_house = soup.select('.con
复制链接

扫一扫