爬虫的获取方式就是拿到服务器返回的源代码,对HTML,CSS和JavaScript代码进行分析,获取自己想要的部分,就是爬虫了把?(就是自己理解的,也不知道对不对,感觉差不多就这样子吧)
首先
from urllib.request import urlopen
url = "http://www.baidu.com"
res = urlopen(url)
# 解码,将格式转为utf-8(这个是包含中文的)
# 声明一个变量接收源代码
src = res.read().decode("utf-8")