爬虫：东方财富网数据爬取

最新推荐文章于 2025-02-23 06:21:08 发布

D227

最新推荐文章于 2025-02-23 06:21:08 发布

阅读量2.4k

点赞数 1

文章标签： python 爬虫

本文链接：https://blog.csdn.net/Deepstudyy/article/details/120797357

版权

本文介绍如何使用Python爬虫下载网页信息，解析HTML获取目标链接和标题，然后将数据转化为DataFrame并存储到MySQL数据库。涉及技术包括requests库、BeautifulSoup解析、正则表达式及数据结构操作。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1、首先构造一个函数download_all_htmls（）爬取网页信息

通过request函数根据路径获取网页信息，获得请求网页权限（可通过反爬虫机制来获取），构造空列表htmls来填入网页所对应的字符内容。

2、调用download_all_htmls函数获取网页内容

3、解析html所获得的相应数据

定义一个函数parse_single_html（html）：用beautifulsoup初始化对象，通过目录路径找到目标总体items。读取items里所有的目标内容，通过正则表达式找到对应的目标对象link和title，并加入已定义的空列表datas，其元素为元组形式。

4、调用函数parse_single_html获取目标对象link和title

并通过pprint批量打印数据，使对象数据更一目了然。再将数据放入已定义的空列表data，最后将data转换为表格型的数据结构DataFrame。

5、将数据存入mysql

首先导入对应的模块create_engine，再设置连接数据库（注意用utf8mb4编码形式来存放较多字符串），最后写入mysql。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

D227

关注关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Python 爬虫实战：在东方财富网抓取股票行情数据，辅助投资决策

u014481728的博客

02-01

4304

通过本文的 Python 爬虫实战，我们成功抓取了东方财富网的股票行情数据，并进行了数据分析和可视化。通过爬虫技术，我们可以快速获取大量的股票行情数据，通过数据分析，可以洞察股票市场的动态和趋势，辅助投资决策。在实际应用中，可以根据需求进一步扩展爬虫功能，例如抓取更多维度的数据、进行更深入的数据挖掘和分析等。

爬虫：爬东方财富网股票数据

weixin_54187787的博客

10-20

2723

1.页面分析此次我们获取数据的网站是东方财富网！首先我们按F12打开开发者模式，对name里面的网页进行观察，找到数据存在的网页，发现数据是以jQuery加载进网页的，每次加载20个数据，如图：至此我们找到了单页网页的数据及地址，接下来我们继续打开第二页，找到每页之间的关系，整理后我们发现第一页的pn值等于1，第二页的pn值等于2：所以我们构建URL时，只需用for循环让params参数中的pn值变为可变动的值，那么这样的话我们都可以对里面的每一页发起请求进而获...

参与评论您还未登录，请先登录后发表或查看评论

爬取东方财富网数据笔记

m0_63151116的博客

10-20

9187

小白是如何学习爬虫的？首先先从简单的入手，在b站上寻找爬虫视频，这里推荐Python爬虫编程基础5天速成（2021全新合集）Python入门+数据分析_哔哩哔哩_bilibili 有编程基础的仅需要观看其中部分爬虫视频即可，如果没有编程基础可以自行观看完整视频。这里的爬虫讲解以豆瓣电影Top250的信息爬取为主，所以通过学习如何爬取豆瓣电影信息为基础，在此基础上摸索爬取东方财富网的信息数据。（爬取豆瓣的代码，在视频中有非常完整的讲解）下面首先爬取了东方财富网的Title 网址：平安银行...

爬虫实战 | 爬取东方财富网股票数据

简说Python的博客

04-13

1万+

↑↑↑关注后"星标"简说Python人人都可以简单入门Python、爬虫、数据分析简说Python推荐来源：志斌的python笔记作者：志斌今天有个朋友说，他想做个...

简单爬虫：东方财富网股票数据爬取(20231230)

热门推荐

Cyber的博客

07-26

1万+

前言因为东方财富网的Js限制，第一页很好爬取，但是第二页开始的网页地址并没有改变，看了下xpath页面元素也和第一页没什么区别，所以只好曲线救国，用selenium找到“下一页”按钮进行跳转再爬取，好处是肯定都能爬到，坏处则是必须一直开着chromedriver，而且爬取效率并不高。代码 from selenium import webdriver from time import sleep import mysql.connector as mysql '''爬取上证指数的所有股票信息，保存到本地

爬取东方财富股票信息

qq_34045989的博客

11-06

1945

本文基于第二种，即selenium，爬取东方财富的股票数据。目标网址：http://quote.eastmoney.com/center/gridlist.html#hs_a_board目标数据：网页table标签中的股票信息。

python如何爬虫股票数据_简单爬虫：东方财富网股票数据爬取(python_017)

weixin_39714528的博客

11-22

2083

需求：将东方财富网行情中心的股票数据爬取下来，包括上证指数、深圳指数、上证A股、深圳A股、新股、中小板、创业板等一、目标站点分析东方财富网的行情中心页面包含了所有股票信息。在左侧的菜单栏中包含了沪深个股、沪深指数等所有股票数据。每个板块的股票数据被隐藏在不同的菜单里。点击“沪深个股”按钮，对应的股票数据就被查询出来了。上方的选项卡中包含了不同板块的板块：沪深A股、上证A股、深证A股、新股、中小板...

python实现爬取东方财富网

iva_brother的博客

06-10

8743

在东方财富网上面有很多关于各个公司报表的信息，通过爬取上面的信息，我们可以分析其中数据，得到一些我们想要的结果！本文通过requests/json/re模块爬取该网站的数据，存储为csv文件。具体代码实现如下！ import requests import re import json import csv import os import time # 设置文件保存本地文件夹下 fil...

东方财富网公告爬取2

04-23

爬取东方财富网公司公告，包括爬取利用ajax加载的网页，以及如何模拟翻页。与上一版增加了对各种错误机制的处理。

02-22

04-11

03-11

Python爬虫实战(基础篇)—15获取东方财富网股票数据—写入csv（附完整代码）

weixin_42636075的博客

04-10

6487

Python爬虫实战(基础篇)—15获取东方财富网股票数据—写入csv（附完整代码）

小白selenium爬取东方财富新闻–学习过程，做个记录

weixin_52629768的博客

05-22

1206

因为对爬虫的爬与反爬理解的并不深刻，所以我有些地方的等待时间可能设置的有些久，受制于我这台2016服役的笔记本电脑，响应起来也确实不容易。最后的m表格就是所需要的内容，本人的爬虫还在初学阶段，有些地方的处理并不成熟，也有很大的改进空间，向csdn上的大佬不断学习。最后，将接受内容的字典储存为excel，并将存有链接的表格和存有内容的表格以“标题”进行合并。接下来，我们将通过遍历访问爬取的链接，爬取我们需要的新闻内容，并保存下来。将我们创建好的字典重新保存为excel格式，用于最后的分析。

爬取股吧评论（东方财经网）

LIFECadilos的博客

05-31

2519

本文使用MySQL数据库，平台用的DBeaver与python进行股吧数据爬取，由于网站的反爬虫机制，本文章添加了随机用户代理与随机延时，但在爬取五六十页后，爬虫页面会变换，基本为方正证卷吧，如果页面变换，过一个小时之后在爬。

记录东方财富网的自定义字体反爬

weixin_34332905的博客

04-13

1356

链接：http://data.eastmoney.com/bbsj/201903/yjbb.html 数据内容是方块，需要找到字体文件。抓包分析，第一条是个api，可以直接获取明文数据，为研究技术这里不用这个，第三条是字体文件用requests请求数据，抄一遍headers，试着把get改成用post，post成功，但数字是乱码，所以需要把乱码改成数字 #把heade...

东方财富网高效爬虫：获取全面信息

本篇文档是关于使用Python进行东方财富网快速爬虫的一个实例。作者通过`urllib`和`re`等库来实现对指定股票列表页面的数据抓取。主要关注以下几个知识点： 1. **Python爬虫基础**：使用Python的`urllib.request`...