Scrapy 实例 - 豆瓣网书单数据存储 CSV文件

最新推荐文章于 2024-04-22 15:42:39 发布

老徐WEB

最新推荐文章于 2024-04-22 15:42:39 发布

阅读量476

点赞数

分类专栏： Python Scrapy 文章标签： Python Scrapy

本文链接：https://blog.csdn.net/uvyoaa/article/details/81208600

版权

怎么从网页里取数据请查看。

这次介绍把数据存储到CSV文件里。

一、修改items.py文件

把需要获取的数据定义在这里，增加两行。

class DoubanxsItem(scrapy.Item):
    # define the fields for your item here like:
    # name = scrapy.Field()
    name = scrapy.Field() # 书名
    author = scrapy.Field() # 作者
    pass

二、从spider里获取数据

首先把item加载进来。

from doubanxs.items  import DoubanxsItem

然后获取数据并返回，详细如下：

三、修改settings.py文件

添加如下三行：

FEED_URI = r'file:///d://tmp/doubanxs.csv' # 存储路径
FEED_FORMAT = 'CSV' # 存储格式
FEED_EXPORT_ENCODING = 'gbk' # 存储编码。因为CSV默认是GBK格式。

四、执行spider

scrapy crawl doubanxs

五、打开CSV文件

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

老徐WEB

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Scrapy 实例 - 豆瓣网书单数据存储 CSV文件

怎么从网页里取数据请查看。这次介绍把数据存储到CSV文件里。一、修改items.py文件把需要获取的数据定义在这里，增加两行。class DoubanxsItem(scrapy.Item): # define the fields for your item here like: # name = scrapy.Field() name = scrapy....
复制链接

扫一扫