beautifulsoup 解析
属性:
soup.a.attrs 返回一字典,里面是所有属性和值
soup.a['href'] 获取href属性
方法一(文本):
soup.a.string (获得a标签字符串)
soup.a.text (获得a标签文本)
soup.a.get_text() (获得a标签文本列表)
方法二(find):
soup.find('a')
soup.find('a', class_="xxx ")
soup.find('a', title="xxx")
soup.find('a', id="xxx")
#soup.find('a', id=re.compile(r'xxx'))本人暂时不用(正则法则)
方法三(select):
soup.select('a')
soup.select('.xxx') (.表示类(class) )
soup.select('#xxx') (#表示id)
soup.select('a[class="xxx"]')