自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 BeauttifulSoup 在获取文本的时候 如何不获取子节点的文本

使用select方法时会获取到后续子节点的所有文本,之前解决的办法时使用lxml库进行提取,很麻烦,终于找到了一个方法:.contents[0]

2023-11-12 16:54:53 223 1

原创 BeautifulSoup学习笔记——获取元素文本

想获取td内的所有文本,之前一直使用lxml库进行解析,但是该方法只能获取单个元素的文本,无法获取元素内的所有文本,使用xpath方法获取所有文本时,由于这里有个style,会获取很多无用的东西,特别麻烦,今天学了一下BeautifulSoup,没想到功能强大多了,直接.text就能获取所有元素内文本,一行就能解决,实在太方便了。

2023-10-21 11:32:36 453 1

原创 selenium获取父节点和包含特定文本的元素的方法

以下代码的含义:首先获取包含文本CDPs的节点,再获取父节点(必须为th节点),进一步获取父节点(必须为tr节点)

2023-09-27 23:58:33 410 1

原创 python中selenium如何定位shadow-root中的元素

最近遇到了这个问题,找了好久,终于找到了,参考的是下面这篇文章,但是这篇文章写的比较简单并且有点小问题,对此进行补充,和记录。

2023-09-20 19:13:07 1734 7

原创 使用python的requests库爬取微信公众号文章中的图片

使用python的requests库爬取微信公众号中的图片和标题

2023-05-05 20:59:02 774 1

原创 利用python的urllib库爬取某度热搜

使用朋友thong的urllib库爬取百度热搜

2023-05-01 00:26:25 341 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除