python爬虫----scrapy爬虫之天气预报

最新推荐文章于 2024-05-03 01:43:28 发布

老问题

最新推荐文章于 2024-05-03 01:43:28 发布

阅读量1.5k

点赞数 1

分类专栏： python

本文链接：https://blog.csdn.net/qq_32511479/article/details/77231576

版权

说到爬虫自然离不开scrapy

那么这次就用scrapy来写一个小爬虫

这次的目标是爬取中国天气网：tianqi.com上的中国各省市当日天气情况

关于scrapy的详细操作和内容就不一一介绍了，简单说一下这次爬虫的步骤吧

操作都是在cmd里用命令行的形式输入

创建一个项目：scrapy startproject tianqi

cd tianqi 进入到这个文件夹

创建一个爬虫：scrapy genspider weather tianqi.com

然后就会在tianqi文件夹里看到一些.py的文件

spdier文件

接下来我们就要在这些.py文件中来做文章

Spider

首先最重要的是spider里的weather.py文件，

它是整个爬虫爬取数据的部分，爬到数据后会返回给PIPELINE处理

# -*- coding: utf-8 -*-
import scrapy
from tianqi.items import TianqiItem #将items导入进来，使得数据能够使用
from bs4 import BeautifulSoup
import re


class WeatherSpider(scrapy.Spider):
    name = 'weather'
    allowed_domains = ['tianqi.com']
    start_urls = ['http://www.tianqi.c

最低0.47元/天解锁文章

老问题

关注

1
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
python爬虫----scrapy爬虫之天气预报

说到爬虫自然离不开scrapy那么这次就用scrapy来写一个小爬虫这次的目标是爬取中国天气网：tianqi.com上的中国各省市当日天气情况关于scrapy的详细操作和内容就不一一介绍了，简单说一下这次爬虫的步骤吧操作都是在cmd里用命令行的形式输入创建一个项目：scrapy startproject tianqicd tianqi 进入到这个文件
复制链接

扫一扫