【爬虫】scrapy爬取股票历史数据并保存成CSV文档

最新推荐文章于 2024-07-20 03:10:49 发布

迷迷迷迷路的鹿鹿

最新推荐文章于 2024-07-20 03:10:49 发布

阅读量2.8k

点赞数 2

分类专栏：实战区爬虫文章标签： scrapy 爬虫下载 csv

本文链接：https://blog.csdn.net/yao09605/article/details/94741769

版权

本文介绍如何使用Scrapy爬虫从指定网址获取股票历史数据，通过连接MongoDB获取股票代码，然后请求下载CSV文件，并利用Scrapy的filepipeline进行文件保存，最终实现将爬取的数据保存为自定义名称的CSV文档。

摘要由CSDN通过智能技术生成

这个爬虫是接着上个爬虫做的，先送上传送门：https://blog.csdn.net/yao09605/article/details/94596341
我们的目标网址是

http://quotes.money.163.com/trade/lsjysj_股票代码.html

股票代码的来源就是上个爬虫存到mongodb里面的股票列表
先在terminal中新建项目:

scrapy startproject stock_history

同样将项目在pycharm中打开，
在这里插入图片描述
首先编辑stock_history_spider.py
第一步，初始化的时候连接上MONGODB，并取出列表。

class StockHistorySpider(scrapy.Spider):
	collection = 'stock_list'
	name = 'stock_history_spider'
	headers = {
   
		'Referer': 'http://quotes.money.163.com/',
		'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36'
	}

	def __init__(self):
		scrapy.Spider.__init__(self)  # 必须显式调用父类的init
		self.log(sys.getdefaultencoding())
		self.current_stock_code = ''
		self.mongo_url = MONGO_URI
		self.mongo_db = MONGO_DB
		self.client = MongoClient(self.mongo_url)
		self.db = self.client[self.mongo_db]
		self.stock_list = self.db[self.collection].find({
   }, {
   'stock_id': 1, '_id': 0}

最低0.47元/天解锁文章

迷迷迷迷路的鹿鹿

关注

2
点赞
踩
21

收藏

觉得还不错? 一键收藏
1
评论
【爬虫】scrapy爬取股票历史数据并保存成CSV文档

这个爬虫是接着上个爬虫做的，先送上传送门：https://blog.csdn.net/yao09605/article/details/94596341我们的目标网址是http://quotes.money.163.com/trade/lsjysj_股票代码.html股票代码的来源就是上个爬虫存到mongodb里面的股票列表先在terminal中新建项目:scrapy startpro...
复制链接

扫一扫

专栏目录