day2笔记-python爬虫-数据解析

正则表达式

参考网址
在这里插入图片描述
通过在 *、+ 或 ? 限定符之后放置 ?,该表达式从"贪婪"表达式转换为"非贪婪"表达式或者最小匹配。

import re
title = "你好,hello,世界"
pattern = re.compile(r'[\u4e00-\u9fa5]+') #这里的+是连接符
result = pattern.findall(title)
print(result)

[‘你好’, ‘世界’]

xpath

lxml的相关类:Element,ElementTree,ElementPath
Xpath语法:
nodename: 选取此节点的所有子节点
/:从根节点选取
//:从匹配选择的当前节点选取文档中的节点,不用考虑位置
. :选取当前节点
… :选取当前节点的父节点
@ : 选取属性

例子:
html = etree.parse(‘hello.html’)
result =html.xpath(’//li/@class’) #返回所有li标签下拥有属性class的属性值

lxml库:大部分功能在lxml.etree模块中
from lxml import etree
语法:

  • 创建节点,添加属性:root = etree.Element(‘root’,interesting = ‘totally’)
  • 获取节点名称:print(root.tag)
  • 已有节点添加属性:root.set(‘age’,‘30’)
  • 将元素序列化为XML树的编码字符串表示形式:etree.tostring(root)
  • 添加文本 :root.text
  • 返回匹配到的第一个子元素:root.find(“a”)
  • 返回一个匹配所有元素的迭代器:root.iterfind(“a”)

etree.fromstring(’<></>’) --返回根节点
etree.XML(’<></>’) --与上同
etree.HTML(’<></>’) --自动增补

bs4

创建beautifulsoup 书P79
涉及到的方法:

  • print(soup.prettify()) 友好显示html内容
  • soup.find_all([‘a’,‘b’]) 查找满足条件 soup.find_all(href=’’,id=’’)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python,异常处理是非常重要的一部分。当程序运行时如果出现错误,如果没有异常处理,程序就会崩溃。为了避免这种情况,Python提供了异常处理机制。 在Python,异常处理语句使用 `try` 和 `except` 关键字来实现。`try` 语句块包含可能会发生异常的代码,如果这段代码出现了异常,则会跳转到 `except` 语句块执行异常处理代码。 下面是一个简单的例子: ```python try: num = int(input("请输入一个整数:")) print(10/num) except ZeroDivisionError: print("除数不能为0") except ValueError: print("输入的不是整数") ``` 在上面的代码,我们尝试将用户输入的字符串转换为整数,并将其用作除数计算 10/num。如果用户输入的是 0,则会触发 ZeroDivisionError 异常。如果用户输入的不是整数,则会触发 ValueError 异常。如果发生异常,则会跳转到对应的 except 语句块执行处理代码。 除了可以指定具体的异常类型,也可以使用 `except Exception` 来捕获所有异常。例如: ```python try: num = int(input("请输入一个整数:")) print(10/num) except Exception as e: print("发生异常:", e) ``` 在上面的代码,如果发生任何异常,都会跳转到 `except` 语句块执行处理代码,并将异常信息打印出来。 除了 `try` 和 `except`,还有 `finally` 关键字,它指定的代码块无论是否发生异常都会执行。例如: ```python try: num = int(input("请输入一个整数:")) print(10/num) except Exception as e: print("发生异常:", e) finally: print("程序执行完毕") ``` 在上面的代码,无论是否发生异常,都会执行 `finally` 的代码,即输出“程序执行完毕”。 总之,在Python,异常处理是非常重要的一部分,它可以有效避免程序崩溃,提高程序的健壮性和可靠性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值