python爬虫--xpath方式清洗数据,清洗失败?(class内容中有空格)
目标:爬取类似下图中帖子的图片
步骤一、找到该帖子的源代码
<div class="threadlist_lz clearfix">
<div class="threadlist_title pull_left j_th_tit member_thread_title_frs ">
<a rel="noreferrer" href="/p/6739292728" title="为什么现在培训班出来的Java学员都找不到工作?" target="_blank" class="j_th_tit ">为什么现在培训班出来的Java学员都找不到工作?</a>
步骤二、爬取网页内容,使用xpath方法获取href的内容
# 构造URL
def tiebaSpider(self):
for page in range(self.beginPage,self.endPage+1):
pn = (page-1)*50
wo = {'pn': pn, 'kw': sel