最近项目需要爬取数据,公款学习新知识。
在需要判断抓取的是否是有效数据时,判断变量类型
html_doc = """
<p class="title"><b><!--The Dormouse's story--></b></p>
"""
soup = BeautifulSoup(html_doc,'lxml') #声明BeautifulSoup对象
find = soup.find('p') #使用find方法查到第一个p标签
str = type(find.b.string)
print(str)
if str.__name__ == 'Comment':
print('该字符是注释')
else:
print('该字符不是注释')
判断变量类型时,需要变量str.__name__进行比较。