从网页获取HTML数据后,获取对应标签、属性的值
取值方法主要有以下几种:
1.通过标签名(tag)获取: tag.name tag对应的type是
2.通过属性(attrs)获取:tag.attrs
通过标签属性获取: tag["class"] 或 tag.get("class")
获取对应的内容
1. tag.string 获取当前标签的内容
2. tag.get_text() 获取标签内所有的字符串
查找相应的内容
1.find_all(class_="class") 返回的是多个标签,格式为
2.find(class_="class") 返回一个标签,格式是
3.select_one() 返回一个标签,格式是
4.select() 返回的是多个标签,格式为
1和4是返回组标签(就算只有一个标签也是一组)
取值时需要先定位,定位是list(ResultSet)中的那个标签在取值
tag[0].string
使用 find_all() 不带条件查找,tag[0]["class"].string
原文:https://www.cnblogs.com/moying-wq/p/10050720.html