python的符号&lt和&gt怎么输入_pythoh3 下 '<abc>' 遇到这样的html转义符如何自动转义呢?...

初学python,在使用scray 爬虫时,遇到html的特殊字符,于是百度搜看了下文档:

import HTMLParser

html_parser = HTMLParser.HTMLParser()

s = '&l t;abc&g t;&nbs p;' #避免网页转义留了个空格

s = html_parser.unescape(s)

运行时提示:

import markupbase

ImportError: No module named 'markupbase'

借助翻译软件,看HTMLParser官方文档找了第二种方法

from html.parser import HTMLParser

class MyHTMLParser(HTMLParser):

def handle_data(self, data):

print(data)

return data

parser = MyHTMLParser()

s = '&l t;abc&g t;&nbs p;' #避免网页转义留了个空格

ss=parser.feed(s)

第二种方法测试成功,遇到的问题是,return data 这一句,返回数据是无效的?

请问,有没有就几句代码解决转义的,如果没有第二种方法里如何才有返回值?

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值