爬虫(BeautifulSoup--select--class的选择)

本文介绍了如何使用BeautifulSoup的select方法选择带有特定class的元素。讲解了无空格和有空格的情况,如select(.item.name)和select(.item .name)的区别,并列举了其他选择方式,包括通过标签名、类名、ID名的查找,以及组合查找和直接子标签查找。同时提到了属性查找,强调了属性与标签在同一节点时中间不应有空格。
摘要由CSDN通过智能技术生成

<div class="item name" title="中央公园">

<a href="/Attraction_Review-g60763-d105127-Reviews-Central_Park-New_York_City_New_York.html" target="_blank" class="poiTitle" οnclick="widgetEvCall('handlers.shelfItemClick', event, this)" data-tpp="Attractions" data-tpact="shelf_item_click" data-tpatt="1|poi|105127" data-tpid="162">

中央公园

</a>

</div>

select(.item.name)  中间不加空格表示选中class为   item name  中包含的元素

<div class="item" title="中央公园">

  <div class = name>中央公园</div>

</div>

select(.item .name)中间有空格 表示选中为 class为item 下 class为 name的元素

select的用法

 

(1)通过标签名查找

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python爬虫中,使用select方法可以通过CSS选择器定位HTML元素。例如,通过select("div")可以选择所有的div元素。 使用select方法时,可以使用空格或者>符号来表示子元素关系。空格表示选择后代元素,而>表示选择直接子元素。例如,select("div span")表示选择div下的所有span元素,而select("div>span")表示选择div的直接子元素中的span元素。 需要注意的是,在爬取网页时遇到<br>或者<br/>隔开的文本内容时,可能只能获取到最后一个文本内容,而不能获取到所有的文本内容。这是因为<br>或者<br/>是HTML中的换行标签,而不是实际的文本内容。如果想要获取到所有的文本内容,可以使用get_text方法,并指定换行标签作为参数,例如get_text('', '<br>')。这样就可以将换行标签替换为空格或者其他可以接受的字符,从而获取到所有的文本内容。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [Python爬虫beautifulsoup <br>](https://blog.csdn.net/weixin_40835949/article/details/85797855)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [零基础python爬虫48小时速成](https://download.csdn.net/download/weixin_36643308/88220343)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值