Python爬虫、数据清洗与可视化-4 - scrapy-练习-1-——爬baidu首页热点

最新推荐文章于 2023-12-21 15:42:19 发布

VIP文章 Adrian-11

最新推荐文章于 2023-12-21 15:42:19 发布

阅读量426

点赞数 1

分类专栏： python项目练习记录文章标签： python

本文链接：https://blog.csdn.net/m0_56267896/article/details/115028361

版权

新手学习日记1-练习
爬baidu首页热点
一、创建工程
用scrapy创建个新项目爬baidu首页热点。命令行下输入命令，命令会在当前目录下创建baiduscrapy项目。

scrapy startproject baiduscrapy
cd baiduscrapy
scrapy genspider baidu "www.baidu.com"

二、修改parse
命令已经帮我们自动创建了爬虫代码，打开spiders文件夹下baidu.py文件，修改如下。

import scrapy
from baiduscrapy.items import BaiduscrapyItem

class BaiduSpider(scrapy.Spider):
    name = 'baidu' #爬虫的名字，运行爬虫的时候就看这个参数。
    allowed_domains = ['baidu.com'] #抓取的域名限制
    start_urls = [</

最低0.47元/天解锁文章

优惠劵

Adrian-11

关注关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫、数据清洗与可视化-4 - scrapy-练习-1-——爬baidu首页热点

新手学习日记1-练习爬baidu首页热点一、创建工程用scrapy创建个新项目爬baidu首页热点。命令行下输入命令，命令会在当前目录下创建baiduscrapy项目。scrapy startproject baiduscrapycd baiduscrapyscrapy genspider baidu "www.baidu.com"二、修改parse命令已经帮我们自动创建了爬虫代码，打开spiders文件夹下baidu.py修改如下。import scrapyfrom baiduscr
复制链接

扫一扫