你的Scrapy保存CSV数据遇到乱码问题?这里有个完美的解决方案!

一、出现的bug

使用scrapy框架爬取数据,保存到csv文件中,并通过excel文件打开出现乱码

在这里插入图片描述
在这里插入图片描述

二、解决方法

(1)方法一:settings.py设置编码格式,后爬取数据

FEED_EXPORT_ENCODING = “utf-8-sig”
FEED_EXPORT_ENCODING = “gbk”
(二选一)

在这里插入图片描述
在这里插入图片描述
(2)方法二:对csv乱码进行处理

(1)通过记事本打开csv文件
(2)选择“另存为”
(3)修改编码格式:将utf-8改为ANSI
(4)确认另存
(5)通过excel重新打开csv文件

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

  • 写在最后:有任何代码问题,欢迎交流~
  • 13
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 7
    评论
Scrapy中,你可以使用以下步骤将数据保存CSV文件中: 1. 在项目的settings.py文件中添加以下代码以启用CSV输出: ```python FEED_FORMAT = 'csv' FEED_URI = 'output.csv' ``` 其中,FEED_FORMAT指定了输出格式为CSV,FEED_URI指定了输出文件的路径和名称。 2. 在Spider中定义item并将其导出到CSV文件中。例如,假设你有一个Spider,它从网站中提取了书籍的信息。你可以在Spider中定义一个item,然后将其导出到CSV文件中。以下是一个示例: ```python import scrapy from scrapy.loader import ItemLoader from scrapy.item import Item, Field class BookItem(Item): title = Field() author = Field() price = Field() class BooksSpider(scrapy.Spider): name = "books" start_urls = [ 'http://books.toscrape.com/catalogue/category/books/science_22/index.html' ] def parse(self, response): for book in response.css('article.product_pod'): loader = ItemLoader(item=BookItem(), selector=book) loader.add_css('title', 'h3 a::attr(title)') loader.add_css('author', 'a::attr(href)') loader.add_css('price', 'p.price_color::text') yield loader.load_item() ``` 在这个示例中,我们定义了一个BookItem类,它有三个属性:title,author和price。在Spider中,我们使用ItemLoader加载器将每个书籍的信息加载到BookItem对象中,然后使用yield语句将其输出到CSV文件中。 3. 运行Spider并查看CSV文件。运行以下命令来启动Spider: ``` scrapy crawl books ``` 当Spider运行时,它会将提取到的数据输出到CSV文件中。你可以打开output.csv文件来查看结果。
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值