1024,对python通过爬虫爬取到的数据,进行简单的处理
#最近在试试爬虫,爬到的内容有一些很乱的字符,虽然不是乱码,但是我不需要那些字符
import re
#这个是要处理的字符串,如果你通过xpath爬到的数据是列表
#可以通过 htmle = ','.join(html_text),仿照这个处理成一整个字符串
htmle = """\r\n,\r\n,\r\n,\xa0,\xa0,\r\n,\r\n,\r\n,\r\n,\r\n,\r\n...
原创
2019-10-24 09:29:09 ·
1164 阅读 ·
1 评论