如何获取网页里的标签文本内容

1.首先我们应该在pythonProject里创建一获取网页标签内容的文件,为了更好地区分每个文件的作用,那我们的命名就要清楚明了,因此,我们就将这次文件的内容命名为“获取标签的文本内容”。

我们应该在这选择我们要创建的文件类型,

再输入文件的名字,以便与其他的文件用作区分。

2.文件创建好了之后,我们就应该先下载lxml,为了更好地获取数据,在终端使用pip install lxml来进行下载

下载完成之后,我们就可以开始获取我们网页的数据了

这是我们在使用lxml对我们的网页进行一个数据的获取

3.当我们要获取【li】中第一个【li】标签下的a元素文本时,就要使用以下代码来进行获取。

4.当我们想要通过class属性定位查找出已知的html中的标签属性和a元素文本内容时,

5.想要通过href属性定位查找出标签属性和啊元素文本内容时,

6.当我们想要通过某种特殊文本内容查找的想要的文本内容时,

如果我们想要获取文本中包括“line-”的所有文本内容时,“”里面输入我们想要查找的文本就可以了,当然了,获取指定的文本内容肯定不止这一种方法,其余的还需要大家多多发现。

7.​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​当我们想要获取网页中所有的元素时,就要通过网页的url地址来进行获取

在代码中还有很多种方法来获取网页的内容,大家也都要努力啊!!!

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值