对某股票数据的爬取

Richard.HX

已于 2024-08-21 00:18:06 修改

阅读量2.5k

点赞数 3

文章标签：爬虫 python 数据分析

于 2022-03-05 23:43:05 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_58718615/article/details/123303063

版权

本文章只用于技术拓展，不得破坏任何网站

1.在爬取之前，我们一定要清楚自己想要的数据；

2.首先我们尽量都设置一下headers；

3.然后我们需要查看到网页的url以及请求方式；

url：就是我们需要访问的网址；

请求方式：一般是post和get两种，我这里主要是get请求（post请求后续会给大家讲解），get请求一般比较简单。

4.再者就是我们在获取数据的时候会涉及到翻页，这时候我们就可以去点击下一页，然后观察url的变化，从而我们就可以观察到规律；

我这个很明显是两个参数在变化，所以我就需要写两个for循环来进行翻页；

5.然后我们需要来查看这个控制翻页的参数取值范围；

我这边是用的BeautifulSoup，然后通过找到对应的标签获取到翻页参数的最大值，当然如果不需要后期再进行爬取，可以直接将这个参数的最大值赋值，就不需要我这一步；

6.最后我们就可以爬取我们所需要的数据；

我这边也是用的BeautifulSoup，当然大家也可以使用正则表达式，但是个人还是倾向去BeautifulSoup；

涉及的方法讲解：

我代码里面涉及到一个self.url_requests(url)这个方法，是我自己写的一个requset请求（包含异常处理），大家可以直接使用request.get(url，headers=header)这个方法，如果需要我写的这个的方法也可以在下面评论联系我，我给大家发出来。

欢迎大家点赞评论

关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。