BeautifulSoup
文章平均质量分 90
OneTwoThreeGo-1-2
这个作者很懒,什么都没留下…
展开
-
基于bs4库的HTML内容查找方法
可以与正则表达式配合使用,进行模糊查找,需要引入正则表达式库。<tag>() 等价于 <tag>.find_all()soup() 等价于 soup.find_all()设置为False只检索儿子节点。参数输入True打印所有标签。原创 2023-04-01 01:49:15 · 749 阅读 · 0 评论 -
Beautiful Soup基本使用
注意:字符串节点也是一个标签,例如\n会车,它也是body的一个标签,在python自带的IDEL环境下打印contents时会显示出来,所以查找真正的第一个标签时,列表的下标可能会为[1]Beautiful Soup是解析、遍历、维护“标签树”的功能库,只要提供的类型是标签类型,都能进行解析。注意:当文本中存在多个一样的标签时,只会获取第一个标签的内容,如例子中的a标签,只获取了第一个标签的内容。Beautiful Soup 的将整个html页面中的标签看成一个标签树,其使用的遍历方式分为。原创 2023-03-29 23:58:00 · 773 阅读 · 0 评论