适合初级人员理解并修改的一个简单的小爬虫

最新推荐文章于 2024-09-19 20:15:19 发布

「已注销」

最新推荐文章于 2024-09-19 20:15:19 发布

阅读量157

点赞数

文章标签： python

本文链接：https://blog.csdn.net/w_boby/article/details/80697083

版权

url='http://699pic.com/tupian/ribenyinghua.html'  #====》这个引号里面是要输入的网址（这里我给了一个网址做参考可运行）

resaut=requests.get(url)
res=resaut.text

reques=BeautifulSoup(res,'html.parser')
# print(reques)   #=====》把print前面的注释解开  可帮你找出你需要的（class和class等号后面的内容）

re=reques.findAll(attrs={'class':'lazy'})

print(re)   #=====》这个可帮你找到图片的src 具体叫啥  有些网站比较鸡贼   把src换成别的名字你只需跟着改即可

num=1
for i in re:
    dedao=requests.get(i['data-original'])  #==》这里面的 data-original就是我获得具体的src的名字
    print(dedao.content)
    f=open('xintu%s.jpg'%num,'wb')  #===》这里到下面就是打开新的图片并保存的一段代码
    f.write(dedao.content)
    f.close()
    num+=1
print('完成')