复制部分网页源代码到本地HTML文件,使用Python ==> pqQuery库 导入本地html文件,实现6行代码输出王者荣耀所有人物角色姓名

本次使用Google浏览器进行测试,先打开王者荣耀官方网站的英雄资料列表页,复制Ul列表到本地IDE编辑器保存为HTML文件,接着编写Python程序,导入Pyquery库并导入本地文件,输出所有li文件,最终得到2020 - 12 - 20日共计103个英雄的结果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前言:本次使用Google浏览器测试(不同浏览器会有些许差异,但是逻辑相通)

1、打开 英雄资料列表页-英雄介绍-王者荣耀官方网站-腾讯游戏 :https://pvp.qq.com/web201605/herolist.shtml

2、我们可以看到下面有各种你喜欢的人物(如百里,火舞,王昭君...),复制 Ul 列表 到本地 IDE编辑器 粘贴代码,保存为 王者荣耀.html(名字随意

3、编写Python程序,导入Pyquery库,导入本地文件,输出所有 li 文件

from pyquery import PyQuery as  pq

with open ('E:/Python_project/王者荣耀.html',encoding = 'utf-8') as f:
    html = f.read()

# 直接在 pyQuery 里面导入本地文件,可能会存在 GBK 编码错误,所以这里使用 with open 方法打开文件,传递给 pyQuery
html = pq(html)
for li in html('li').items():
    print(li.text())
    # print(li('div').eq(3).text())

# 如果需要选取里面的第几个元素,可以使用.eq()方法,确认选择第几个(元素从1开始)

F、输入结果如下(2020-12-20日,共计103个英雄~):

澜
夏洛特
阿古朵
蒙恬
镜
蒙犽
鲁班大师
西施
马超
曜
云中君
瑶
盘古
猪八戒
嫦娥
上官婉儿
李信
沈梦溪
伽罗
盾山
司马懿
孙策
元歌
米莱狄
狂铁
弈星
裴擒虎
杨玉环
公孙离
明世隐
女娲
梦奇
苏烈
百里玄策
百里守约
铠
鬼谷子
干将莫邪
东皇太一
大乔
黄忠
诸葛亮
哪吒
太乙真人
蔡文姬
雅典娜
杨戬
成吉思汗
钟馗
虞姬
李元芳
张飞
刘备
后羿
牛魔
孙悟空
亚瑟
橘右京
娜可露露
不知火舞
张良
花木兰
兰陵王
王昭君
韩信
刘邦
姜子牙
露娜
程咬金
安琪拉
貂蝉
关羽
老夫子
武则天
项羽
达摩
狄仁杰
马可波罗
李白
宫本武藏
典韦
曹操
甄姬
夏侯惇
周瑜
吕布
芈月
白起
扁鹊
孙膑
钟无艳
阿轲
高渐离
刘禅
庄周
鲁班七号
孙尚香
嬴政
妲己
墨子
赵云
小乔
廉颇

 

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值