基于前俩天的学习内容进行简单总结
soup = beautifulsoup('<html>.......<html>',features = 'html.parser')
——>soup.find() #找到第一个符合条件的
例:v1 = soup.find('div') #找到soup子类里面第一个div标签
v1 = soup.find(id = 'li') #找到soup子类里面第一个id=li的
v1 = soup.find('div',id='li') #组合使用,找到soup子类里面第一个div标签,并且id=li的
——>soup.find_all() #找到所有符合条件的 返回值为列表
v2 = soup.find('div') #找到soup子类里面所有div标签
v2 = soup.find(id = 'li') #找到soup子类里面所有id=li的
v2 = soup.find('div',id='li') #组合使用,找到soup子类里面所有div标签,并且id=li的
obj = v1 # v1是个对象
obj = v2[0] #v2是个列表,通过循环或者索引获得obj,obj是个对象
#对象也是标签
#标签获得文本的方法是 : obj.text
#标签获得其属性的方法是: obj.attrs