一.获取主页面源代码——requests模块
import requests
这一步是导入一个requests模块
导入方法:import +模块/for + 模块+import+函数/类
url(变量) = "网址"
这一步将你想要爬取的网址用一个双引号括起来,并命名url
resp(变量) = requests.get(url)
这一步借用requests模块中的get函数(函数内部你要输入从哪获取)获取一个响应并把这个响应赋给resp
二.解析源代码
from lxml import etree
这一步从lxm模块中导入etree类
html(变量) = etree.HTML(resp.text)
借用etree类中HTML函数(该函数是有实际情况来进行选着)来解析这源代码并把解析后的结果赋给htm