爬取东方财富股票信息网

没有使用复杂的方法,最简单的了下面是图文

创建python的一个文件,需要导入的库

 

 

 

连接数据库配置,配置headers

下一步就 百度搜索 东方财富,进入随便找个股票,以上证个股为例

看下这个页面的逻辑,有分页,分也时 url是不变的,很明显就是ajax了,我用的最low的方法就是遍历 url

http://nufm.dfcfw.com/EM_Finance2014NumericApplication/JS.aspx?cb=jQuery112408117789619119797_1540286711822&type=CT&token=4f1862fc3b5e77c150a2b985b12db0fd&sty=FCOIATC&js=(%7Bdata%3A%5B(x)%5D%2CrecordsFiltered%3A(tot)%7D)&cmd=C.2&st=(ChangePercent)&sr=-1&p=1&ps=20&_=1540286711823

第一页20条数据 第二页到最后都是20条

逻辑就在  这个url里面,  &p=1 &ps=20     最后一个&_=1540286711823 这个貌似可有可无  看效果

p=1 改成5   ps=20 改成5  第五页出现五条数据

逻辑清晰了  name就可以写代码了

之所以用最low的方法  就是这个最不费劲  ,爬取json数据最简单,url已给 进去的直接包装拿走就行了

跳过ajax  直接遍历url  每页一条数据,看了下总共1442条,format就行了

然后就是json数据的格式  正则把不需要的给去掉

写入数据库的时候 字段有点多 不要写错了 不然就各种报错

这么low的代码 到这里也就写完了,各位大神们手下留情,我也是个小白 入行不久    应该对小白们稍微有些许帮助。我知道自己有许多不足,我会继续努力!

 

 

爬取东方财富股票数据存储excel,需要先了解如何从东方财富网站获取数据。首先要编写爬虫程序,通过网络爬虫技术从东方财富网站上获取一定的股票数据。可以采用Python语言编写爬虫程序,通过requests库获取网页源代码,再用BeautifulSoup库解析HTML代码,找到所需的股票数据,并用pandas库将数据存为Excel文件。 首先,需要分析东方财富网站上存储股票数据的URL地址和参数。然后,通过requests库的get()方法请求网站,将URL地址和参数传递给get()方法,以获取该网站的源代码。接着,用BeautifulSoup库解析HTML代码,找到需要的股票数据信息。可以通过查看该网站的网页源代码,选择相应的HTML标签和CSS类名抓取数据。 完成数据爬取后,需要将得到的数据存储到Excel文件中。可以使用pandas库进行数据处理和转换,将数据以DataFrame的形式存储到Excel文件中。在生成Excel文件的过程中,可以通过设置Excel的各种属性和格式,使得Excel文件更具有可读性和美观度。最后,通过Python编程,可以实现自动化更新和批量处理数据的功能,大大提高数据处理效率和工作质量。 总之,爬取东方财富股票数据存储Excel需要具备爬虫技术、分析网页源代码、数据处理和Excel常规操作等多项技能。只有掌握了这些技能,并善于将它们运用到实际工作中,才能快速、高效地获取所需的有价值的股票数据。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值