爬取东方财富股票信息网

最新推荐文章于 2024-08-22 10:13:09 发布

李先sheng

最新推荐文章于 2024-08-22 10:13:09 发布

阅读量1.7k

点赞数 3

文章标签：爬虫股票

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41767339/article/details/83310230

版权

没有使用复杂的方法，最简单的了下面是图文

创建python的一个文件，需要导入的库

连接数据库配置，配置headers

下一步就百度搜索东方财富，进入随便找个股票，以上证个股为例

看下这个页面的逻辑，有分页，分也时 url是不变的，很明显就是ajax了，我用的最low的方法就是遍历 url

http://nufm.dfcfw.com/EM_Finance2014NumericApplication/JS.aspx?cb=jQuery112408117789619119797_1540286711822&type=CT&token=4f1862fc3b5e77c150a2b985b12db0fd&sty=FCOIATC&js=(%7Bdata%3A%5B(x)%5D%2CrecordsFiltered%3A(tot)%7D)&cmd=C.2&st=(ChangePercent)&sr=-1&p=1&ps=20&_=1540286711823

第一页20条数据第二页到最后都是20条

逻辑就在这个url里面， &p=1 &ps=20 最后一个&_=1540286711823 这个貌似可有可无看效果

p=1 改成5 ps=20 改成5 第五页出现五条数据

逻辑清晰了 name就可以写代码了

之所以用最low的方法就是这个最不费劲，爬取json数据最简单，url已给进去的直接包装拿走就行了

跳过ajax 直接遍历url 每页一条数据，看了下总共1442条，format就行了

然后就是json数据的格式正则把不需要的给去掉

写入数据库的时候字段有点多不要写错了不然就各种报错

这么low的代码到这里也就写完了，各位大神们手下留情，我也是个小白入行不久应该对小白们稍微有些许帮助。我知道自己有许多不足，我会继续努力！

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。