爬虫学习笔记
记忆中绽放那花
这个作者很懒,什么都没留下…
展开
-
re模块方法
1.re.match re.match(pattern, string, flags=0) re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。 匹配成功re.match方法返回一个匹配的对象,否则返回None。group(num) 或 groups() 匹配对象函数来获取匹配表达式 2.re.search re.search 扫描整个字符串并返回第一个成功的匹配 re.search(pattern, string, .原创 2020-05-23 22:50:21 · 184 阅读 · 0 评论 -
爬虫学习
对象的种类 Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象:Tag , NavigableString , BeautifulSoup , Comment。 print(soup.prettify())#自动更正格式,使输出更美观 Tag:name,attrs contents属性只返回直接子节点 descendants属性可以获取当前节点所有的子孙节点。 for i,child in enumerate(so...原创 2020-05-18 22:36:34 · 257 阅读 · 0 评论