1.什么是爬虫?
爬虫是一种程序。从网站上获取各种各样的图片,音乐,视频,文档。
2.爬一个网址:浏览器右上角菜单--更多工具--开发者工具。
选择网络,然后选择新媒体。
浏览器右上角点刷新,就能看见1-3条数据。
点击任意一条数据(效果一样),就能在标头中看见链接。
3.获取网站数据:下载模块:文件--设置--项目--python解释器--点+号--输入模块下载
导入模块 :import requests
使用模块:res=request.get(url)
4.把得到的内容保存在电脑上:打开文件:open("文件名","打开方式")
文件名随便取
打开方式是读写的问题,是文本文件还是二进制文件
文本文件:txt
二进制文件:mp3 mp4 jpg png exe doc ppt
读:从文件中读取数据 r(read) rb(read-binary)
写:从文件中写入数据 w(write) wb(write-binary)
5.代码
import requests
url="网址名"
res=requests.get(url)
open("1号.mp4","wb").write(res.content)