适合初级人员 理解 并修改的 一个简单的小爬虫

url='http://699pic.com/tupian/ribenyinghua.html'  #====》这个引号里面是要输入的网址(这里我给了一个网址做参考可运行)

resaut=requests.get(url)
res=resaut.text

reques=BeautifulSoup(res,'html.parser')
# print(reques)   #=====》把print前面的注释解开  可帮你找出你需要的(class和class等号后面的内容)

re=reques.findAll(attrs={'class':'lazy'})

print(re)   #=====》这个可帮你找到图片的src 具体叫啥  有些网站比较鸡贼   把src换成别的名字你只需跟着改即可

num=1
for i in re:
    dedao=requests.get(i['data-original'])  #==》这里面的 data-original就是我获得具体的src的名字
    print(dedao.content)
    f=open('xintu%s.jpg'%num,'wb')  #===》这里到下面就是打开新的图片并保存的一段代码
    f.write(dedao.content)
    f.close()
    num+=1
print('完成')
阅读更多
文章标签: python
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭
关闭