利用Python来抓取炉石所有卡牌!然后生成女神小姐姐图片!吊不吊

640?wx_fmt=jpeg

炉石传说原画2

本打算使用Selenium模拟点击获取图片信息

尝试发现源码中 该按钮并无相应的跳转链接

640?wx_fmt=jpeg

这不应该啊 没有相应的跳转链接 点击后是如何加载新的图片?

后来浏览整体网站源码后 发现把问题想复杂 根本不需要模拟点击查看更多

640?wx_fmt=jpeg

网站其实已经加载了所有的卡牌原画 只是之后的原画做了隐藏处理默认不展示 style=display

点击查看更多后 显示原画

那么只需使用requests获取网页源码

用BeautiSoup/正则表达式/pyQuery解析元素 遍历相应img的url 即可下载

Github

640?wx_fmt=jpeg

炉石传说卡牌链接

640?wx_fmt=jpeg

炉石传说卡牌

该网站通过下拉右边的滚动条不断加载新的卡牌

与上一个网站不同 上一个网站一次性写入了所有卡牌 只不过做了隐藏处理

该网站是通过js动态加载渲染出的卡牌 直接获取源码 无法得到所有卡牌信息

那么就用selenium模拟下拉滚动条(selenium简直居家必备之神器)

640?wx_fmt=jpeg

第一次没有设置停留时间 无法获取新的数据 怀疑自己 怀疑人生

经前端/后端好友L君的提示 需增加暂停时间 这样才能获得加载渲染后的数据

browser.page_source便可获得动态加载的所有数据

有了数据 之后就很简单 正则匹配获取相应url下载即可

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

谢谢你!

顺手拼一下女神

640?wx_fmt=jpeg

640?wx_fmt=jpeg

漂亮吧,漂亮就对了!

推荐一个Python实战圈?

提供清晰的多角度学习路径、快速学习运用python的圈子

圈主是世界500强高级软件工程师,多年编码经验。

具体可以提供以下内容:

【基础】0基础入门python,24小时有人快速解答问题;

【提高】40多个项目实战,老手可以从真实场景中学习python;

【直播】不定期直播项目案例讲解,手把手教你如何分析项目;

【分享】优质python学习资料分享,让你在最短时间获得有价值的学习资源;圈友优质资料或学习分享,会不时给予赞赏支持,希望每个优质圈友既能赚回加入费用,也能快速成长,并享受分享与帮助他人的乐趣。

【人脉】收获一群志同道合的朋友,并且都是python从业者

【价格】本着布道思想,只需 50元 加入一个能保证学习效果的良心圈子

长按下图二维码,了解python实战圈详情。

640?

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值