BeautifulSoup
通过BeautifulSoup爬取
名字 | 功能 |
---|---|
.attrs | 返回tag在属性 |
.contents | 所有儿子节点 |
.children | 所有儿子节点的迭代类型 (迭代器) |
.descendants | 子孙迭代类型 |
.parent | 返回父亲标签 |
.parents | 返回父辈标签的迭代类型 |
.next_sibling | 返回HTML的下一个文本顺序的平行标签(注意平行标签只是指属于同一父亲节点的标签) |
.previous_sibling | 返回HTML的上一个文本顺序的平行标签 |
.next_siblings | 返回HTML的下面所有文本顺序下的平行标签 |
.previous_sibling | 返回HTML的上面所有文本顺序下的平行标签 |
.prettify() | 为html文本的tag添加换行符和空格符(使得对于html很漂亮的打印出来) |