爬虫爬取东方财富网的股票走势图

最新推荐文章于 2024-05-09 11:41:42 发布

八云虹

最新推荐文章于 2024-05-09 11:41:42 发布

阅读量1.2k

点赞数 2

分类专栏： python自学的自我总结

本文链接：https://blog.csdn.net/qq_55777983/article/details/117957968

版权

python自学的自我总结专栏收录该内容

7 篇文章 1 订阅

订阅专栏

简单的爬取东方财富网股票走势图

首先先说一下我们用到的库
selenium
使用这个库需要安装浏览器驱动
chrom浏览器的web driver（chromedriver.exe），可以在下面网址访问：
http://npm.taobao.org/mirrors/chromedriver/
firefox（火狐浏览器）的web driver （geckodriver.exe）在这里访问：
https://github.com/mozilla/geckodriver/releases
其他浏览器驱动可以见下面列表:
Edge:https://developer.microsoft.com/en-us/micrsosft-edage/tools/webdriver
Safari:https://webkit.org/blog/6900/webdriver-support-in-safari-10/

记得放在一个简单的路径，方便代码中使用
先来观察一下网页在这里插入图片描述
000001是我用来测试的第一个目标，我们直接在搜索框中进行搜索。按f12查询页面代码，我们发现数据指向的页面的url的格式更方便我们进行爬取。

我们可以进入这个URL查看

很明显，右边这幅图就是我们需要进行截取的图。

下面我们可以开始写代码
首先，要导入我们的库，并设置好我们的浏览器驱动器的目录

from selenium import webdriver#导入我们的库
driver = webdriver.Chrome(executable_path="F:\webdriver\chromedriver.exe")
#这里的路径就是存放我们的浏览器驱动的地方
for i in range(a, b):
#a就是要爬取的股票代码中打头的那个代码，b就是要爬取的最后一个的股票代码+1
        try:
            driver.get("http:data.eastmoney.com/stockdata/" + i + ".html")
            #使用我们之前发现更适合循环的URL，将i(股票代码)插入它该在的地方
            driver.set_window_size(200,400)
            #设置合适的窗口大小
            driver.execute_script('window.scrollBy(800,650)')
            #设置窗口的滚动条滚到合适的位置
            title = driver.title
            #获取网页标题
            title = title.split("_", 1)[0]
            #取出网页标题中我们需要的部分
            if len(title)>10:
                continue
             #如果该股票代码是空缺位那么title会很长那样的话不要浪费时间直接跳过
            driver.get_screenshot_as_file("F:\picture\ " + i  + ".png")
            #截取屏幕图片并保存到目标路径
        except:
            continue

这些天学习爬虫也算学会了点简单爬虫
先写个简单的爬虫，后面有空再写完善一些
感觉主流爬虫库还是requests那些多一些
只是感觉这次用selenium方便一些。

八云虹

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
爬虫爬取东方财富网的股票走势图

简单的爬取东方财富网股票走势图首先先说一下我们用到的库selenium使用这个库需要安装浏览器驱动chrom浏览器的web driver（chromedriver.exe），可以在下面网址访问：http://npm.taobao.org/mirrors/chromedriver/firefox（火狐浏览器）的web driver （geckodriver.exe）在这里访问：https://github.com/mozilla/geckodriver/releases其他浏览器驱动可以见下面
复制链接

扫一扫

专栏目录