学习目标:
网络爬虫步骤:
import requests:导入库
r=requests.get('ur1'):发送并返回请求资源对象
print(r.status_code):查着状态码(是否发送成功)
r.encoding:查看网页编码
r.apparent.encoding:根据网页内容评估的备用编码
r.text:查看整个网页内容
r.encoding=r.apparent_encoding:将备用编码替换头编码
r.text[-500:]
r.text[:1000]
from bs4 import BeautifulSoup
demo=text[ :1000]
soup=BeautifulSoup(文本/网页内容,html.parser)
print(soup. prettify())
学习内容:
欧克,接下来我们实际操作下。
嗯就比从网络上抓取一张蝙蝠侠的图片
#图片爬取
import requests
r=requests.get('https://pic2.zhimg.com/50/v2-76d77ea8cbf4a3fa50856451f1803049_720w.jpg?source=54b3c3a5')
path='../picture/蝙蝠侠.jpg'
try:
f=open(path,'wb')
f.write(r.content) #写入二进制文件
f.close()
print('文件保存成功')
except:
print('爬虫失败!')
结果如下
怎么样是不是很有趣?一起动手尝试下吧
ok,以上内容的学习的目的地就到这里,作为Python初学者欢迎各位积极探讨,喜欢的同学可以在下方评论留下属于你的宝贵意见