爬虫 : 通过编写程序的方式获取互联网上的资源
需求 : 用程序模拟浏览器,输入一个网址,并且从网址中获取需要的资源
步骤 :
-
从
python
中导入一个包from urllib.request import urlopen
-
准备好网址
url = http://www.****.com
-
打开网址
resp = urlopen(url)
-
获取内容
resp.read() print(resp.read().decode("Utf-8"))
-
将获取的内容,写入指定文件
with open("文件名",mode="w",encodinf="Utf-8") as f: f.write(resp.read.decode("Utf-8"))
例子
输入
from urllib.request import urlopen
url = "http://www.baidu.com"
resp = urlopen(url)
with open("C://Users//lixt6//Desktop//mybaidu.html",mode="w",encoding="Utf-8") as f:
f.write(resp.read().decode("Utf-8"))
用浏览器打开文件 mybaidu.html
就可以看到百度的页面啦