抓取页面内容时,在打印的时候会出现类似“\u0005”、“\u0006”的字符,可以这样处理:
m = '\u0005'.decode('unicode-escape').encode('utf8')
title = title.replace(m, '')
此时title中就不会再出现“\u0005”字符了
抓取页面内容时,在打印的时候会出现类似“\u0005”、“\u0006”的字符,可以这样处理:
m = '\u0005'.decode('unicode-escape').encode('utf8')
title = title.replace(m, '')
此时title中就不会再出现“\u0005”字符了