python爬虫之 BeautifulSoup修复残损的html文本
原因
众所周知,当你使用lxml解析html文本时,它是不能解析残损的html文本的,所以一旦你下载的是残损的文本,它也要么解析不出来,要么parse出错,那怎么解决呢?
Beautifulsoup
首先 pip install beautifulsoup4, pip install htmllib5
data = requests.get(url=get_url, headers=hea...
原创
2019-04-30 15:53:51 ·
692 阅读 ·
0 评论