老鱼Python数据分析——篇十二：使用selenium+BeautifulSoup获取淘股吧数据

最新推荐文章于 2025-03-21 13:39:35 发布

宇哥编程

最新推荐文章于 2025-03-21 13:39:35 发布

阅读量3.8k

点赞数 2

分类专栏：老鱼Python数据分析文章标签： python selenium BeautifulSoup

本文链接：https://blog.csdn.net/xy229935/article/details/90176607

版权

在淘股吧发现有位大牛每天都有数据整理，地址：湖南人的博客

所以直接下载他的博客文章即可。

分析发现，他复盘的数据都是使用的图片，所以只需要把博客文章里面的图片下载到本地。

第一步：分析首页数据：

通过blogs = self.browser.find_elements_by_css_selector(".article_tittle")，可以得到首页的文章列表，点击超链接跳转到内容页。

第二步，分析内容页数据：

找到上图DIV中的所有图片，然后下载即可。

实现代码如下：

一、打开首页，遍历文章列表

二、根据文章列表打开文章详情页

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

宇哥编程

关注关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
5
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

python爬虫-爬取股票贴吧帖子

victordiao的博客

08-10

7040

因为课题需要爬取大量的股吧的股民讨论情况，以此继续探讨股民情绪对股票走势的影响而我负责爬虫和分词工作，亲手写了一个爬虫代码，来爬取股吧-东方财富吧的股友会帖子信息代码如下：#!/usr/bin/env python # -*-coding:utf-8 -*- import urllib import urllib2 import re #导入对excel文件进行操作的库 import xlw

老鱼Python数据分析——篇十：使用selenium获取历史数据并保存

十方上下

05-13

1892

具体实现步骤如下：一、打开打开盯盘页面，分析日期控件。二、点击该区域，出现年-月-日界面。三、点击“1”号，判断日期是否已改变，改变后下载数据。四、重复步骤一、二、三，一直点击到该月最后一天，如果是当前月份，则点击到当天结束。实现代码如下： from selenium import webdriver from bs4 import BeautifulSoup ...

5 条评论您还未登录，请先登录后发表或查看评论

python爬虫之Scrapy爬取股票信息的示例

Blackoutdragon的博客

05-25

2119

初次使用scrapy框架，对着教程的理解，期待下次的实战

Python基础：爬虫

最新发布

呱牛 Just do IT

03-21

951

Python爬虫是一种自动化程序，它使用Python编写，用于从网络上自动抓取网页数据并提取有用信息。Python因为其简洁的语法、丰富的库支持以及强大的网络处理能力，成为了实现爬虫功能的热门选择。下面，我们将简要介绍Python爬虫的基础知识和一个简单的爬虫示例。

淘股吧帖子爬取

Luzaofa的博客

05-21

6806

所有内容仅为本人在学习过程中的积累，欠缺不足忘指教，谢谢所有内容仅为本人在学习过程中的积累，欠缺不足忘指教，谢谢 import requests import re import time import random from bs4 import BeautifulSoup from pymongo import MongoClient def get_url(url): ...

运用python爬取股票的股吧评论、新闻报道（附完整代码）

qq_45856698的博客

02-28

6322

当前，文本信息挖掘十分火热，文本信息挖掘作为一个新的数据挖掘领域，其目的在于把文本信息转化为人可利用的知识，而获取文本信息是文本信息挖掘工作中最重要、最首要的关键一环，那么如何快速、高效、批量地获取文本信息呢？那当然要提到今天的主角"爬虫"啦！下面介绍如何利用Python爬取每支股票对应的股吧评论、新闻公告，所爬取网站为某财富网站。

Eastmoney-Spyder：股吧网页数据抓取分析（二）

希望你会喜欢

03-14

6323

说到这里，抓取股吧数据的细节部分说的差不多了，如果我想到新的内容再和大家分享，关于IP代理池的详细使用说明，就在下一章节中再和大家分享啦，下期再见啦！（2022年更新说明：关于【IP代理池】的文章目前效果不佳，可当做业余技能学习，对抓取工作可能没有太多成效）.........

【BeautifulSoup】、【使用BeautifulSoup抓取QZZN论坛中每个帖子的标题、url及对应帖子的回复内容】

bettyantony的博客

02-14

426

一、数据解析常用的三种方式——③BeautifulSoup 1.使用时需要使用BS转类型 response = requests.get(url,headers=self.headers) #转类型-------------<class 'bs4.BeautifulSoup'> #默认bs4会调用你系统中的lxml的解析库警告提示 #如果不想看到警告，可以主动设置 bs4的解析库-...

老鱼Python数据分析——篇六：使用selenium获取动态数据

十方上下

04-11

6392

现在很多页面上的数据都是动态加载，所以使用scrapy来爬取页面，只能得到页面HTML的布局代码，而不能获得数据。而且对于新手，上路就使用scrapy爬动态数据比较困难，所以使用selenium来打开浏览器，再加载页面获得数据。需求：统计每天大盘收盘后的汇总数据。找到了一个网站https://xuangubao.cn/dingpan，每天收盘后的数据都在该页面上。下...

老鱼Python数据分析——篇十八：消息推送（一）

十方上下

07-10

3720

需求分析这两天想把分析处理之后的数据，做一个定时发送，按照自己设想和百度搜索，发现有以下几种办法。（只是我发现比较大众化的办法，不代表只有这几种方法）发送邮件 QQ机器人微信机器人极光API 技术测试最后经过实际测试，微信机器人和极光API都能满足我的需求，但各有优缺点！ QQ机器人使用的是Web端QQ接口，而WebQQ现在已经停用，舍弃！邮件发送延时太高，最高长达到3分钟，因...

老鱼Python数据分析——篇九：项目重构(代码)

十方上下

05-10

1369

修改后的结构如下图所示： common目录下是通用文件，test目录下是功能文件，test目录下的agudata用于保存A股每月的数据一、xgb_data.py，用于保存xgb网站需要的个人信息，如登录的账号密码，第二次使用的COOKIE信息等二、mysql_oper.py 对mysql数据库的操作，连接数据库，查询和增删改三、datetime_oper.py 将指...

股吧评论抓取及分析

01-27

python 实现股吧评论抓取及分析

当Python爬虫遇到br标签......

m0_59236127的博客

02-23

2478

一、观察网页二、请求、解析数据三、问题四、问题的解决完整代码。

爬虫案例：股吧，使用Selenium

qq_42283061的博客

05-07

425

实用工具关注公众号爬虫探索者获取。发送对应关键词

爬虫项目-爬取股吧（东方财富）评论

weixin_45056021的博客

11-05

5215

5.完整代码如下所示，在修改第二步之后是可以直接运行的，如果不能成功运行可以下面评论，或者私聊我，我会帮你解答。

【Python爬虫】项目案例讲解，一步步教你爬取淘宝商品数据！

mate1357的博客

01-20

1087

随着互联网时代的到来，人们更加倾向于互联网购物，某宝又是电商行业的巨头，在某宝平台中有很多商家数据，今天带大家使用python+selenium工具获取这些公开的商家数据这次的受害者：淘宝购物平台

对选股宝实时信息进行爬虫

weixin_42558459的博客

06-28

3348

一、创建一个scrapy项目在开始爬取之前，我们首先要创建一个scrapy项目，在命令行输入一下命令即可创建 scrapy startproject mingyan如果你输入命令之后，出现了下面的显示：说明已经创建成功，我们来看一下目录结构：二、创建一个scrapy蜘蛛文件上面我们已经成功创建了一个scrapy 项目，那我们该在哪里写我们的蜘蛛呢？在spiders目录下面，这一个sc...

Python爬虫实战（1）：爬取Drupal论坛帖子列表

一起学习Python网络爬虫

06-06

3940

在《Python即时网络爬虫项目: 内容提取器的定义》一文我们定义了一个通用的python网络爬虫类，期望通过这个项目节省程序员一半以上的时间。本文将用一个实例讲解怎样使用这个爬虫类。我们将爬集搜客老版论坛，是一个用Drupal做的论坛。

爬虫系列-雪球网选股策略爬取程序1.0

明亮的专栏

08-16

4439

个人网站地址：http://www.enjoyown.com/spider-xueqiu/昨天领导安排我整理知名网站上的选股策略，整理了半天，全部手敲的，因为APP没办法复制文本，很蛋疼，今天闲下来了就写了这个爬虫，将所有的策略抓取并保存到MySQL数据库，这样下次连拷贝都剩了，直接MySQL导出excel，一分钟就解决问题，喜欢请 star，谢谢。 Git地址 URL https://git