通过requests的get方法得到对应url 的页面,然后直接使用re 的正则表达式来查找对应的图片的地址,最后将图片保存在本地。
这个可以算的上是自己的第一个python 爬虫了吧。。。。
新手,有很多不好的地方,欢迎交流
import requests
import sys
import io
import re
import os
url = "http://c.tieba.baidu.com/p/5287949986"
html=requests.get(url)
url_list = re.findall(r"http://imgsrc.baidu.com/forum/.*?\.jpg",html.text)
root = "E://pics//"
file=open(root+"demo.txt","a")
for url in url_list:
file.write(url+