python xpth和bs4提取img标签和src时的不同点

用xpath爬取图片信息提取img标签中src内容时出错

1.用bs4提取src时用get()方法可以直接取出链接

	img = child_page.find("div",attrs={"class":"pic"}).find("img")
    src = img.get("src")
    #	输出结果
    #	http://img.netbian.com/file/2021/0922/cc33c63137086b834249910906b5bcd3.jpg

用该方法取出的src可以直接用requests.get()访问

2.用xpath提取src时用@src提取出的内容存在于列表中,当时用requests.get()直接访问就出错了,所以需要把列表中内容再取出来才能用

	src = div2.xpath("./div/div[1]/div/div/img/@src")
	print(src," ")
	#	纠错前的输出结果
	#	['https://p3-search.byteimg.com/img/labis/147e3a6e226d8717ef958087926548fa~tplv-tt-cs0:360:224.webp']  
	src = div2.xpath("./div/div[1]/div/div/img/@src")
    print(src[0]," ")
    #	纠错后的输出结果
    #	https://p3-search.byteimg.com/img/labis/147e3a6e226d8717ef958087926548fa~tplv-tt-cs0:360:224.webp  

综上,xpath和bs4还是有区别的,确实不明白错误原因的时候怎么搞也搞不出来,明白了之后都觉得这个小细节错误是不该犯的,嘿嘿~~

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值