Python 截取字符函数

python 专栏收录该内容
1 篇文章 0 订阅

       在工作中我们经常会遇到某种情况需要截取字符串中某个特定标签之间的内容(爬虫可能用到的较多),适用于很多情况例如字符串形式的xml报文、json格式的字符串以及其它类型的字符串。因为我总结了有关字符串截取的两个函数来记录一下,以供参考。

# 方法一:简单截取不重复标签中的内容
def substr(mystr, startStr, endChar):
    '''
    自定义字符串截取函数:只从字符串中第一次遇见的内容
    '''
    startStr_len = len(startStr)
    start_index = mystr.index(startStr)
    end_index = mystr.index(endChar)
    return mystr[start_index+startStr_len:end_index]

'''
a = 'abc111bcd abc222bcd'
result = substr(a, 'abc', 'bcd')    # result='111'

'''

# 方法二:重复截取标签中的内容并将结果作为列表返回
def substr_to_list(mystr, startStr, endChar):
    '''自定义字符串截取函数'''
    result = []
    position = 0
    while True:                # 因为index()函数如果没有找到想要的内容会报异常ValueError
        try:            
            startStr_len = len(startStr)
            endChar_len = len(endChar)
            start_index = mystr.index(startStr, position)
            end_index = mystr.index(endChar, position)
            position = end_index + endChar_len
            result.append(mystr[start_index+startStr_len:end_index])
        except Exception as e:
            break
    return result
'''
a = 'abc111bcd abc222bcd'
result = substr(a, 'abc', 'bcd')    # result=['111','222']
'''

效率方面就没有考虑啦,毕竟都用python了还考虑什么效率,哈哈!

  • 0
    点赞
  • 0
    评论
  • 0
    收藏
  • 打赏
    打赏
  • 扫一扫,分享海报

©️2022 CSDN 皮肤主题:大白 设计师:CSDN官方博客 返回首页

打赏作者

ajklsdnal

你的鼓励将是我创作的最大动力

¥2 ¥4 ¥6 ¥10 ¥20
输入1-500的整数
余额支付 (余额:-- )
扫码支付
扫码支付:¥2
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值