爬虫爬取东方财富网的股票走势图

简单的爬取东方财富网股票走势图

首先先说一下我们用到的库
selenium
使用这个库需要安装浏览器驱动
chrom浏览器的web driver(chromedriver.exe),可以在下面网址访问:
http://npm.taobao.org/mirrors/chromedriver/
firefox(火狐浏览器)的web driver (geckodriver.exe)在这里访问:
https://github.com/mozilla/geckodriver/releases
其他浏览器驱动可以见下面列表:
Edge:https://developer.microsoft.com/en-us/micrsosft-edage/tools/webdriver
Safari:https://webkit.org/blog/6900/webdriver-support-in-safari-10/

记得放在一个简单的路径,方便代码中使用
先来观察一下网页在这里插入图片描述
000001是我用来测试的第一个目标,我们直接在搜索框中进行搜索。按f12查询页面代码,我们发现数据指向的页面的url的格式更方便我们进行爬取。
在这里插入图片描述
我们可以进入这个URL查看
在这里插入图片描述
很明显,右边这幅图就是我们需要进行截取的图。

下面我们可以开始写代码
首先,要导入我们的库,并设置好我们的浏览器驱动器的目录

from selenium import webdriver#导入我们的库
driver = webdriver.Chrome(executable_path="F:\webdriver\chromedriver.exe")
#这里的路径就是存放我们的浏览器驱动的地方
for i in range(a, b):
#a就是要爬取的股票代码中打头的那个代码,b就是要爬取的最后一个的股票代码+1
        try:
            driver.get("http:data.eastmoney.com/stockdata/" + i + ".html")
            #使用我们之前发现更适合循环的URL,将i(股票代码)插入它该在的地方
            driver.set_window_size(200,400)
            #设置合适的窗口大小
            driver.execute_script('window.scrollBy(800,650)')
            #设置窗口的滚动条滚到合适的位置
            title = driver.title
            #获取网页标题
            title = title.split("_", 1)[0]
            #取出网页标题中我们需要的部分
            if len(title)>10:
                continue
             #如果该股票代码是空缺位那么title会很长那样的话不要浪费时间直接跳过
            driver.get_screenshot_as_file("F:\picture\ " + i  + ".png")
            #截取屏幕图片并保存到目标路径
        except:
            continue

这些天学习爬虫也算学会了点简单爬虫
先写个简单的爬虫,后面有空再写完善一些
感觉主流爬虫库还是requests那些多一些
只是感觉这次用selenium方便一些。

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值