爬虫实例(三)——股票数据定向爬虫

最新推荐文章于 2024-08-02 09:56:06 发布

不多余的星星

最新推荐文章于 2024-08-02 09:56:06 发布

阅读量4.9k

点赞数 1

分类专栏：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/CJX_up/article/details/77912510

版权

本文介绍了如何使用Python爬虫从东方财富网和百度股票获取股票列表及个股详细信息。通过分析网页源代码，定位股票链接和数据元素，设计程序结构并处理可能的异常。最终将数据保存至文件。

摘要由CSDN通过智能技术生成

功能描述

目标：获取上交所和深交所所有股票的名称和交易信息
输出：保存到文件中
技术路线：requests‐bs4‐re

候选数据网站的选择

选取原则：股票信息静态存在于HTML页面中，非js代码生成
没有Robots协议限制
选取方法：浏览器F12，源代码查看等
选取心态：不要纠结于某个网站，多找信息源尝试

具体选取过程请看课程视频：北京理工大学公开课《Python网络爬虫与信息提取》

数据网站的确定

获取股票列表：
东方财富网：http://quote.eastmoney.com/stocklist.html

获取个股信息：
百度股票：https://gupiao.baidu.com/stock/
单个股票：https://gupiao.baidu.com/stock/sz002439.html

查看东方财富网的源代码，可以发现个股链接在标签 <a> <script type="math/tex" id="MathJax-Element-4"></script> 中，并且链接都是在东方财富网的链接后面加上 sh(上海) 或者 sz(深圳) 再加上 6 个数

最低0.47元/天解锁文章

不多余的星星

关注

1
点赞
踩
12

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。