爬取inner html转义,requests-html 怎么获取对应的innerText

requests-html 怎么获取一个 标签的innerText

def stage_catch():

session = HTMLSession()

r = session.get('http://www.dmzx.com/manhua/358/')

div = r.html.find('.subsrbelist')

list_a = div[0].find('ul')[0].find('a') # 找到对应目录列表

for a in list_a:

print(a)

print(a.attrs)

print(a.text)

# pages = re.sub("\D", "", total_pages)

# print(pages)

pass

if __name__ == '__main__':

stage_catch()

这个是我对应的节点

第360话

(18页)

{'href': 'http://www.dmzx.com/manhua/358/2000089062.html', 'title': '第360话', 'target': '_blank'}

全职猎人 (第360话) (18页)

这是我的三次输出。 我使用a.text 输出的时候不是

我想调用类似 a.innerText直接获取到innerText 也就是"(18页)",但是没有这个方法。

我暂时转成字符串然后处理对应的字符串了。。。。

我想知道对于这些python库我有什么办法测试他有什么对应的js中的方法。

我试了下dir(a) 获取到了方法,和text有关的都试了一次页发现不行。。。。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值