每天一个Python案例教学，专业Python讲师详细讲解猫舍数据爬取并可视化步骤

最新推荐文章于 2024-08-14 23:30:40 发布

weixin_57709891

最新推荐文章于 2024-08-14 23:30:40 发布

阅读量70

点赞数

分类专栏：每天一个Python案例教学讲解文章标签： python 爬虫

本文链接：https://blog.csdn.net/weixin_57709891/article/details/120480734

版权

每天一个Python案例教学讲解专栏收录该内容

1 篇文章 0 订阅

订阅专栏

#猫舍数据爬取
main.py

#pip install requests -i http://pypi.douban.com/simple --trusted-host=pypi.douban.com
import requests
import parsel
import csv

f=open('data.csv',mode='a',encoding='ANSI',newline='')
csv_writer=csv.DictWriter(f,fieldnames=["标题","地区","店名","价格"])
csv_writer.writeheader()
for page in range(1,2):
    print(f'=================正在爬取第{page}页数据内容=================')
    url=f'http://maomijiaoyi.com/index.php?/chanpinliebiao_c_2_{page}--5.html'
    headers={
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.82 Safari/537.36'
    }
    response=requests.get(url=url,headers=headers)
    # print(response.text)
    selector=parsel.Selector(response.text)
    href=selector.css('div.content:nth-child(1) a::attr(href)').getall()
    areas=selector.css('div.content:nth-child(1)  .area .color_333::text').getall()
    areas=[i.strip() for i in areas]
    for index in zip(href,areas):
        index_url='http://www.maomijiaoyi.com'+index[0]
        area=index[1]
        # print(index_url+' '+index[1])
        response_1=requests.get(url=index_url,headers=headers)
        selector_1=parsel.Selector(response_1.text)
        title=selector_1.css('.detail_text div.title::text').get().strip()   #标题
        shop=selector_1.css('.dinming::text').get().strip() #店名
        price=selector_1.css('span.red.size_24::text').get()     #价格
        dit={
            "标题":title,
            "地区":area,
            "店名":shop,
            "价格":price
        }
        csv_writer.writerow(dit)
        print(title,area,shop,price,sep=' | ')

weixin_57709891

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
每天一个Python案例教学，专业Python讲师详细讲解猫舍数据爬取并可视化步骤

#猫舍数据爬取main.py#pip install requests -i http://pypi.douban.com/simple --trusted-host=pypi.douban.comimport requestsimport parselimport csvf=open('data.csv',mode='a',encoding='ANSI',newline='')csv_writer=csv.DictWriter(f,fieldnames=["标题","地区","店名","价
复制链接

扫一扫

专栏目录