1.文字保存成文档 h_list=etree.HTML(page_text) div_list=h_list.xpath('//section[@class="list"]/div') fp=open('5.txt','w',encoding='utf-8') for div in div_list: title=div.xpath('./a/div[2]/div/div/h3/text()')[0] fp.write(title+'\n')
2. 图片保存到文件夹
# 如果不存在piclibs文件夹,那就新建一个文件夹 if not os.path.exists('./Libs'): os.mkdir('./Libs')
# 存储 图片content 是二进制形式 img_data=requests.get(url=img_src,headers=headers).content # 图片名 img_path = 'Libs/'+img_name with open(img_path,'wb')as fp: fp.write(img_data) print(img_name,'下载成功!')