就像是CSDN博客的文章内容标签:<div class="article-item-box csdn-tracking-statistics" data-articleid="92185040">,(注意中间使用空格的,为了明显一点,我多加了几个空格)如果你直接按照
doc.select("div.article-item-box csdn-tracking-statistics")是无效的,那该如何选择该元素呢?
其实我们可以把上面的代码当做是这样的(有两个class属性):<div class="article-item-box" class="csdn-tracking-statistics">,所以我们可以这样处理:doc.select("div.article-item-box.csdn-tracking-statistics")。
参考:python beautifulsoup select带有空格的class