python tag对象下有多个标签、属性_Python--BeautifulSoup4丶Tag丶Xpath丶requests+re的基础学习及使用...

本文介绍了Python的面向对象概念,包括类定义、实例化和属性。接着讲解了BeautifulSoup4库在网页解析中的应用,如获取标签、属性,并对比了与XPath的使用。同时,展示了如何结合requests库爬取并解析网页内容。
摘要由CSDN通过智能技术生成

1. 面向对象

1.1 类定义 , 属性 , 初始化

1. 面向对象最重要的概念就是类(Class) 和实例(Instance), 面向对象编程是一种编程设计思想.

classCat:"""这是一个猫类"""

#class 关键字#Cat 类名 同变量名 大驼峰命名法#三引号中的内容是解释这个类的用途

2. 实例化对象

kitty = Cat()

3. 属性

kitty =Cat()#添加属性

kitty.color = 'white'kitty.eat= 'fish'

4. 实例化--初始化

1 #Cat实例化

2 classCat:3 """猫类"""

4 #初始化方法

5 def __init__(self, color ,eat):6 self.color =color7 self.eat =eat8

9 kitty = Cat('white','fish')

View Code

1.2 类和函数

1 #类和函数

2 classPoint:3 """表示二位平面中的一个点"""

4 #初始化方法

5 def __init__(self, x ,y):6 self.x =x7 self.y =y8

9 defdistance(self , p2):10 return ((self.x-p2.x)**2 + (self.y-p2.y)**2)**0.5

11

12 defprint_point(self):13 print('%s,%s'%(self.x,self.y))14

15 pp1=Point(1,2)16 pp2=Point(3,5)17 Point.distance(pp1,pp2)18 #函数式调用方法,一般不这么用

19 Point.print_point(pp1)20 #对象的方式调用

21 pp1.print_point()

View Code

2. 网页解析

Web浏览器的作用是读取HTML文档,并以网页的形式显示出它们,浏览器不会显示HTML标签, 而是使用标签来解释页面的内容.

2.1 http解析库 BeautifulSoup4

BeautifulSoup 是一个可以从 html 或xml 文件中提取数据的Python库, 它的使用方式对于正则来说更加的简单方便, 常常能够

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值