Python3 + BeautifulSoup 爬取Steam热销商品数据

最新推荐文章于 2025-01-27 23:40:08 发布

Brusse1s_xu3

最新推荐文章于 2025-01-27 23:40:08 发布

阅读量2.7k

点赞数 2

文章标签： python steam beautifulsoup 爬虫 o(￣ヘ￣o＃)

本文链接：https://blog.csdn.net/weixin_42852210/article/details/88677672

版权

本文介绍了使用Python3和BeautifulSoup库爬取Steam热销商品数据的过程，通过列表避免重复爬取，并利用zip()函数处理多表遍历。发现Steam最后10页存在重复数据，非防爬机制所致。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这次用了BeautifulSoup库来爬取Steam的热销商品，BeautifulSoup更侧重的是从页面的结构解析，
根据标签元素等来爬取数据，这次遇到两个问题：
1.Steam热销商品列表经常有重复的，所以我建了一个列表，把爬到的数据存进去，每次爬的时候都校验跟列表里有没有重复，有的话就跳过，防止重复爬取。
2.我需要同时遍历两个表，找到了zip()函数解决方案，下面简单介绍一下。

zip()

大家看下面的实例应该就能明白。

xs = ['我是','你是','他是']
ys = ['第一','第二','第三']

for x, y in zip(xs,ys):
	print(x+y)

输出结果如下：

我是第一
你是第二
他是第三

下面是完整爬虫代码，使用的库请自行安装不另做教学：

from bs4 import BeautifulSoup
import xlwt,os,time,requests

page = 1 #起始页数
total_pages = 3 #总页数，爬10页请设定为11
count = 1 #每抓到一次游戏名称增加一次，用来排序
pool=[]

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Brusse1s_xu3

关注关注

2
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

如何使用Python爬虫进行虚拟商品市场分析：抓取游戏道具交易平台数据

2201_76125261的博客

02-13

1381

游戏道具：包括装备、皮肤、武器等，通常用于在游戏中提升玩家的角色能力或外观。游戏账户：玩家购买或出售的游戏账户，账户通常拥有一定的等级、装备或资源。虚拟物品交易平台：各类第三方平台，玩家可以通过这些平台买卖虚拟商品。常见的虚拟商品交易平台包括Steam市场、淘宝、腾讯的游戏物品交易平台等。这些商品的交易一般通过特定平台完成，平台上商品的价格通常受供需关系、商品稀缺度、市场热度等因素的影响。

构建游戏道具数据爬虫：爬取虚拟商品价格与交易记录分析

热门推荐

weixin_43150094的博客

07-03

1万+

Steam游戏的爬取与分析本文爬取了steam冒险类游戏中热销产品中的7500个游戏进行统计分析 1、首先要先知道网页链接的组成形式： 2、其次查看我们想要爬取的信息区域： 3、开始分析：（1）、url的分析：我们发现冒险类游戏的url：https://store.steampowered.com/tags/zh-cn/冒险当点击+页数的时候：可以发现url尾部增加了： #p=1&tab=TopSellers url变成了：https://store.steampowered.com/t

微信小程序的一些坑一些总结（持续更新）

weixin_38824257的博客

09-02

2107

最近参与了几个微信小程序的开发，其中有使用到小程序原生、uni-app和mpvue的方式开发。期间遇到了各种各样的坑以及一些小程序本身能力的限制。现归纳如下，让大家少走点弯路。 1.原生组件遮挡弹出框问题。（map，textarea等） 2.iOS全面屏底部黑色横条适配 3.iOS下日期格式转换问题 4.input输入框的问题 5.保存文件到本地的问题 ...

python爬取steam网页热销游戏的信息

flockyverbiage的博客

06-14

2051

用python简单爬取steam网页上热销产品的基本信息：游戏名称、价格和发行时间。

python scrapy 爬取steam游戏

Little Snow White

03-15

5367

目标网页：游戏列表页游戏详情页游戏评论目标数据：列表页：游戏标题，游戏价格，折扣，评论总数，好评比例详情页：游戏图片，游戏简介，游戏评论 ...

python爬虫——获取依据steam当前在线玩家人数排列的最热门游戏

我的博客

04-01

2705

先看一个爬虫入门的小程序——获取中国最好大学排名 import requests from bs4 import BeautifulSoup allUniv = [] def getHTMLText(url): try: r = requests.get(url, timeout=30) r.raise_for_status() r.enco...

https://store.steampowered.com/search/?filter=topsellers爬取steam畅销榜的游戏价格、原价、折扣

05-31

好的，我可以使用Python中的requests和BeautifulSoup库来实现该功能。以下是代码示例： ```python import requests from bs4 import BeautifulSoup url = '...

python爬虫爬取steam,epic,origin平台游戏数据

zamaochick的博客

01-04

9177

这是我们课程实训的一个功能模块，实现将steam,epic,origin游戏价格信息爬取出来，由于三个网站的构造不一样，加载数据的方式也不一样所以我们需要采用不同的方法来爬取这三个平台的游戏数据用到的工具包 BeautifulSoup包提取爬取网页标签的属性值(游戏的价格信息等) selenium的webdriver 利用脚本实现动态加载数据 requests 爬取网页数据用 mysql 数据表具体实现步骤 1. 提取steam数据首页url https://store.steampowere

SteamTest.py

03-26

用于获取steam市场页上“最新上架”的内容

python 爬取steam/csgo市场数据

weixin_41396062的博客

04-27

9946

在不登录的情况下频繁访问steam市场很容易被禁止访问，由于steam社区市场被墙了，所以需要挂vpn才能正常爬数据首先挂好VPN，登录网页版steam，得到cookies和user-agent的内容，然后复制到headers中的cookies和user-agent位置上设置好相关的路径后就可以了得到的数据会保存到csv文件中 csgo的每一种箱子都会有一个对应的id，得到相应的ID然后保...

Python 爬虫实战：在 Steam 游戏平台，爬取热门游戏评分与评测

u014481728的博客

01-27

2354

通过本文的实战项目，我们成功使用 Python 编写爬虫程序，从 Steam 平台抓取了热门游戏的评分和评测数据，并进行了有效的数据处理、分析和可视化展示。这一过程让我们熟悉了爬虫开发的各个环节，从网页结构分析到数据的获取、处理和展示。反爬虫机制：Steam 平台可能会采取反爬虫措施，如限制请求频率、验证码验证等。我们虽然通过设置请求头模拟浏览器来降低被检测的风险，但仍需谨慎操作，避免过度频繁请求导致 IP 被封禁。数据准确性：网页结构可能会随着平台的更新而发生变化，这可能导致爬虫代码无法准确提取数据。

Steam游戏信息爬取-热销榜价格好评率折扣评论

DDDHL_的博客

01-03

9944

Python 爬取Steam热销榜信息最近学习了一下爬虫，练练手，第一次写文章，请多多包涵O(∩_∩)O 爬取Steam热销榜：游戏排名、游戏名字、价格、好评率、游戏详情页面跳转链接。 Steam热销榜爬虫Python 爬取Steam热销榜信息一、开始爬虫前1.引入库2.读入数据二、分析网页1.首先观察价格，有两种形式，一种是原价，一种是打折后的价格2.名字、游戏详情页链接3.好评率三、爬取信息并处理1.游戏详情页面链接2.好评率3.名字、价格四、信息保存五、主函数六、全部代码七、总结1.心情一、开始

python爬取steam/epic喜加一信息高效白嫖

gudu12306的博客

10-13

1712

python爬虫之爬取steam/epic喜加一信息前言爬虫自动发送微信源代码外链前言免费的就是最好玩的，对于steam/epic上免费送的游戏我们当然一个也不想错过。尤其是epic上的每周免费，动不动就是大作。但是每天去网站搜索喜加一信息也不是办法，因此写了一个爬虫，代码比较简单 Created with Raphaël 2.3.0开始设定时间？爬取喜加一数据发送微信消息休眠一分钟退出？结束yesnoyesno 爬虫爬取的网站为https://steamstats.cn/xi 通过reques

Python爬取steam特惠促销榜

forthenight996的博客

04-14

1376

Python爬取steam特惠促销榜用python爬取https://store.steampowered.com/search/?os=win&specials=1&filter=topsellers的steam特惠促销信息 import requests from bs4 import BeautifulSoup import bs4 def Get_html(url): try: r=requests.get(url,timeout=30)

用Python实时获取steam“特惠游戏”数据还不赶快学起来！！

想学习python欢迎在评论区留言，我看到都会用心回复

07-04

683

Python爬取【steam特惠】游戏数据（游戏名、游戏类型、原价、折扣价等）

英文名看不懂？爬取steam游戏中文优惠信息

这是仙草哥哥的博客

06-14

1787

对之前的爬取的游戏优惠信息的程序进行简单的修改，使其能够支持中文的游戏名

python爬虫-steam登录cookie刷新实现记录

XIAOXIANG233233的博客

12-10

2917

最近发现之前一直用的steam登录cookie刷新接口无了，每天cookie就会掉线一次。只好再次打开steam网页版尝试抓包。比较简单的两个接口，无需js逆向等工作，还是挺轻松的。希望这篇文章对你有所帮助。