零基础建议可以先看python语法,然后看看《Python3 网络爬虫开发实战》
此为b站上北理爬虫的截屏笔记,每课的代码都在里面了,配合视频回顾
p17
p18
p19
可用devtool
p23
查看父亲节点
查看标签
p24 bs遍历
soup.body下面有5个节点
注意,不是同一个父节点不能平行遍历,只有body下的p标签可以
p25
prettify,使内容显示更加清晰
p27 信息标记方式
xml
有内容:<...>....<.../>
无内容:<..../>
注释:<!--...-->