python:爬虫
文章平均质量分 83
不怕猫的耗子A
天空一无所有,为何还给我安慰
展开
-
python爬虫:BeautifulSoup_遍历文档树
前提、回顾1、因为最近工作中都是在跟XML格式的报文打交道:主要就是XML报文的解析、入库。在做自动化时,需要解析XML报文,前面虽然学习过下BeautifulSoup,结果这次在写脚本时,突然发现前面学的还不是很全(当时也没想到会用到这么多,就随便了解了下),所以现在又得在回顾、补充下2、在实际写的时候发现,其实BeautifulSoup在解析XML时跟解析HTML差不多,只是说在指定解...原创 2020-01-16 22:34:03 · 2078 阅读 · 0 评论 -
python爬虫:BeautifulSoup_搜索文档树
搜索文档树1、Beautiful Soup定义了很多搜索方法,这里着重介绍2个: find() 和 find_all()2、使用find_all()类似的方法可以查找到想要查找的文档内容过滤器1、介绍find_all()方法前,先介绍一下过滤器的类型,这些过滤器贯穿整个搜索的API。过滤器可以被用在tag的name中,节点的属性中,字符串中或他们的混合中2、过滤器只能作为...原创 2019-08-15 22:53:25 · 1246 阅读 · 0 评论 -
Python爬虫:BeautifulSoup库
Beautiful Soup的简介Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据。官方解释如下:1、Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。2、Beautiful Soup自动将输...原创 2019-08-12 21:45:03 · 20458 阅读 · 2 评论