遇见导入module找不到的情况
解决方法
将最顶层文件加入根目录,并更改ITEM这个导入类的方式
实际上根据检测只需要更改导入路径就可以了,只是单独运行这个py有错误提示但爬虫工作没有问题
爬虫工作
抓取完成
转换csv,用excel打开发现中文乱码
- 使用scrap代码(scrapy crawl 项目名称 -o 项目名称.csv -s FEED_EXPORT_ENCIDING=utf-8)
- 将生成的csv文件使用记事本打开,然后另存为格式为ASCll的文件,再打开就发现中文正常了
- 还有一种是在setting里面设置,但我实测失败。可以看看这篇文章,感觉就是他这样的做法,单纯地设置一行代码可能不起作用的。
转发: 点击