爬虫爬取王者荣耀英雄

最新推荐文章于 2024-07-31 08:45:00 发布

antRain

最新推荐文章于 2024-07-31 08:45:00 发布

阅读量842

点赞数

分类专栏： python爬虫文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41146650/article/details/100047228

版权

python爬虫专栏收录该内容

6 篇文章 0 订阅

订阅专栏

爬虫爬取王者荣耀英雄

爬取英雄所在标签
得到英雄详情页与图片地址

爬取英雄所在标签

import requests
import bs4
from bs4 import BeautifulSoup
# https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/#


def main():
    url = u'https://pvp.qq.com/web201605/herolist.shtml'
    html = requests.get(url=url)
    html.encoding = 'gbk'
    bs = bs4.BeautifulSoup(markup=html.content, features='lxml')
    hero_list = bs.find_all(href=re.compile('herodetail'))
    file = open(file='../file/out.txt', mode='w', encoding='utf')
    for i in hero_list:
        file.write(str(i)+'\n')
    file.close()


if __name__ == '__main__':
    main()

得到英雄详情页与图片地址

import bs4
from bs4 import BeautifulSoup


def main():
    hero_href =[]
    hero_img = []
    hero_name = []
    with open(file='../file/out.txt', mode='r', encoding='utf-8') as f:
        for i in f:
            bs = bs4.BeautifulSoup(markup=i, features='lxml')
            hero_href.append(bs.a['href'])
            hero_img.append(bs.a.img['src'])
            hero_name.append(bs.img['alt'])
    href = 'https://pvp.qq.com/web201605/'
    img ='https:'
    file = open(file='../file/out1.txt', mode='w', encoding='utf-8')
    total = len(hero_href)
    for i in range(total):
        file.write(str(hero_name[i])+' '+ href+str(hero_href[i])+' '+img+str(hero_img[i])+'\n')
    file.close()


if __name__ == '__main__':
    main()

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

antRain CSDN认证博客专家 CSDN认证企业博客

码龄7年

400: 原创

3万+: 周排名

1万+: 总排名

56万+: 访问

: 等级

8441: 积分

715: 粉丝

594: 获赞

142: 评论

3453: 收藏

私信

关注

热门文章

分类专栏

最新评论

ruoyi-vue-pro 使用记录（2）
qq_28723095: 爱你，兄弟
ruoyi-vue-pro 使用记录--工作流BPM系统
qq_46151999: 有没有AI的表
ruoyi-vue-pro 使用记录（2）
JonSnowYcc: 这边有会员的https://blog.csdn.net/weixin_39753799/article/details/141566232
计算机网络原理图2
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)增加除了各种控件外，文章正文的字数；(3)提升标题与正文的相关性。
Java Web 常见问题
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。