Python网络爬虫实例2:Scrapy框架爬取股票数据

最新推荐文章于 2023-04-09 20:03:04 发布

Nightingale07

最新推荐文章于 2023-04-09 20:03:04 发布

阅读量929

点赞数 2

分类专栏： python 文章标签： python 爬虫

本文链接：https://blog.csdn.net/xu1194947097/article/details/102615369

版权

本文通过Python的Scrapy框架实现从东方财富网和雪球获取股票信息，包括股票名称和交易信息，数据最终保存到文件。教程涵盖工程创建、spider编写、pipelines配置以及并发连接优化。

摘要由CSDN通过智能技术生成

Python网络爬虫实例2:Scrapy框架爬取股票数据

一、功能描述

目标：获取上交所和深交所所有股票的名称和交易信息

输出：保存到文件中

技术路线：scrapy

二、数据网站的确定

获取股票列表：
东方财富网-http://quote.eastmoney.com/stocklist.html
获取个股信息：
- 雪球：https://xueqiu.com/S/
- 单个股票：https://xueqiu.com/S/SH600198

三、股票数据Scrapy爬虫实例编写

建立工程和spider模板

\>scrapy startproject XueqiuStocks

\>scrapy genspider stocks xueqiu.com

编写spider

配置spider.py

# -*- coding: utf-8 -*-
import scrapy
import re

class StocksSpider(scrapy.Spider):
    name = 'stocks'
    start_urls = ['http://quote.eastmoney.com/stock_list.html']

    def parse(self, response):
        for href in response.css('a::attr(href)').extract():
        	try:
        		stock = re.findall(r"[s][hz]\d{6}",href)[0]
        		url = <

最低0.47元/天解锁文章

Nightingale07

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
Python网络爬虫实例2:Scrapy框架爬取股票数据

股票数据Scrapy爬虫一、功能描述目标：获取上交所和深交所所有股票的名称和交易信息输出：保存到文件中技术路线：scrapy二、数据网站的确定获取股票列表：东方财富网-http://quote.eastmoney.com/stocklist.html获取个股信息：老虎社区：https://www.laohu8.com/雪球：https://xueqiu.com/S/...
复制链接

扫一扫