萌新一枚,记录一下今天学习的一些收获,求大神们轻喷!!!
本节目标:学会筛选出评分大于3的文章,并且展示其标题与对应的分类
S1 使用BeautifulSoup解析网页
Soup = BeautifulSoup(html,‘lxml’)
左:汤 右:如何做汤的汤料以及食谱
从谷歌浏览器复制下来的代码一般有两种复制形式:
(1)对于需要的部分右键检查,对于源码copy选择copy selector
CSS Selector:谁,在哪,第几个,长什么样
形式:body > div.main-content > ul > li:nth-child(1) >img
(2)对于需要的部分右键检查,对于源码copy选择copy xpath
XPath:谁,在哪,第几个
形式:/html/body/div[2]/ul/li[1]/img
网页间元素的大概结构示例如下:
导入BeautifulSoup
用open 函数打开网页文件
使用Soup解析网页