使用 Maxsplit 限制拆分
.split()有另一个可选参数称为maxsplit. 默认情况下,.split()将在调用时进行所有可能的拆分。maxsplit但是,当您为 赋值时,只会进行给定数量的拆分。使用我们之前的示例字符串,我们可以看到maxsplit:
s = “this is my string”
s.split(maxsplit=1)
[‘this’, ‘is my string’]
如上所示,如果设置maxsplit为1,则第一个空白区域将用作分隔符,其余的将被忽略。让我们做一些练习来测试到目前为止我们学到的一切。
练习:“自己尝试:Maxsplit”显示隐藏
当你给一个负数作为maxsplit参数时会发生什么?
解决方案:“自己尝试:Maxsplit”显示隐藏
.split()将在所有可用的分隔符上拆分您的字符串,这也是maxsplit未设置时的默认行为。
练习:“部分理解检查”显示隐藏
您最近收到了一个格式非常糟糕的逗号分隔值 (CSV) 文件。您的工作是将每一行提取到一个列表中,该列表的每个元素代表该文件的列。是什么让它格式错误?“地址”字段包含多个逗号,但需要在列表中表示为单个元素!
假设您的文件已作为以下多行字符串加载到内存中:
Name,Phone,Address
Mike Smith,15554218841,123 Nice St, Roy, NM, USA
Anita Hernandez,15557789941,425 Sunny St, New York, NY, USA
Guido van Rossum,315558730,Science Park 123, 1098 XG Amsterdam, NL
您的输出应该是一个列表列表:
[
[‘Mike Smith’, ‘15554218841’, ‘123 Nice St, Roy, NM, USA’],
[‘Anita Hernandez’, ‘15557789941’, ‘425 Sunny St, New York, NY, USA’],
[‘Guido van Rossum’, ‘315558730’, ‘Science Park 123, 1098 XG Amsterdam, NL’]
]
每个内部列表代表我们感兴趣的 CSV 行,而外部列表将它们保存在一起。
解决方案:“部分理解检查”显示隐藏
这是我的解决方案。有几种方法可以攻击它。重要的是您使用.split()了它的所有可选参数并获得了预期的输出:
input_string = “”"Name,Phone,Address
Mike Smith,15554218841,123 Nice St, Roy, NM, USA
Anita Hernandez,15557789941,425 Sunny St, New York, NY, USA
Guido van Rossum,315558730,Science Park 123, 1098 XG Amsterdam, NL"“”
def string_split_ex(unsplit):
results = []
Bonus points for using splitlines() here instead,
which will be more readable
for line in unsplit.split(‘\n’)[1:]:
results.append(line.split(‘,’, maxsplit=2))
return results
print(string_split_ex(input_string))
我们.split()在这里打了两次电话。第一次使用可能看起来很吓人,但别担心!我们将逐步完成它,您会对这些表达式感到满意。让我们再看看第一个.split()调用:unsplit.split(‘\n’)[1:].
第一个元素是unsplit,它只是指向输入字符串的变量。然后我们有我们的.split()电话:.split(‘\n’)。在这里,我们正在拆分一个称为 换行符 的 特殊字符 。
有什么作用\n?顾名思义,它告诉正在读取字符串的任何人,它后面的每个字符都应该显示在下一行。在像我们这样的多行字符串中,每行末尾input_string都有一个隐藏\n。
最后一部分可能是新的:[1:]. 到目前为止的语句给了我们一个内存中的新列表,[1:]看起来像一个列表索引符号,它是——有点!这个扩展的索引符号给了我们一个列表 slice。在这种情况下,我们取 index 处的元素1及其后的所有元素,丢弃 index 处的元素0。
总之,我们遍历一个字符串列表,其中每个元素代表多行输入字符串中除了第一行之外的每一行。
在每个字符串中,我们.split()再次调用using,作为拆分字符,但这次我们只使用maxsplit前两个逗号进行拆分,而地址保持不变。然后我们将该调用的结果附加到恰当命名的results数组并将其返回给调用者。
连接和连接字符串
另一个基本的字符串操作与拆分字符串相反:字符串 连接 。如果你没见过这个词,别担心。这只是说“粘合在一起”的一种奇特方式。
与+运算符连接
有几种方法可以做到这一点,具体取决于您要实现的目标。最简单和最常用的方法是使用加号 ( +) 将多个字符串相加。只需将 a 放在+您想要连接在一起的任意数量的字符串之间:
‘a’ + ‘b’ + ‘c’
‘abc’
为了与数学主题保持一致,您还可以将字符串相乘以重复它:
‘do’ * 2
‘dodo’
请记住,字符串是不可变的!如果连接或重复存储在变量中的字符串,则必须将新字符串分配给另一个变量以保留它。
orig_string = ‘Hello’
orig_string + ‘, world’
‘Hello, world’
orig_string
‘Hello’
full_sentence = orig_string + ‘, world’
full_sentence
‘Hello, world’
如果我们没有不可变的字符串,full_sentence则会输出’Hello, world, world’.
另一个注意事项是 Python 不进行隐式字符串转换。如果您尝试将字符串与非字符串类型连接起来,Python将引发一个TypeError:
‘Hello’ + 2
Traceback (most recent call last):
File “”, line 1, in
TypeError: must be str, not int
这是因为您只能将字符串与其他字符串连接起来,如果您来自像 JavaScript 这样试图进行隐式类型转换的语言,这对您来说可能是一种新行为。
在 Python 中从列表到字符串 .join()
还有另一种更强大的方法可以将字符串连接在一起。您可以使用该join()方法从 Python 中的列表转换为字符串。
这里的常见用例是当您有一个由字符串组成的可迭代对象(如列表),并且您希望将这些字符串组合成一个字符串时。就像.split(),.join()是一个字符串实例方法。如果您所有的字符串都在一个可迭代对象中,您会调用哪一个.join()?
这是一个有点棘手的问题。请记住,当您使用 时.split(),您将在要拆分的字符串或字符上调用它。相反的操作是.join(),因此您可以在要用于将可迭代字符串连接在一起的字符串或字符上调用它:
strings = [‘do’, ‘re’, ‘mi’]
‘,’.join(strings)
‘do,re,mi’
在这里,我们strings用逗号 ( ,)连接列表的每个元素,并调用.join()它而不是strings列表。
练习:“通过加入提高可读性”显示隐藏
如何使输出文本更具可读性?
解决方案:“通过加入提高可读性”显示隐藏
您可以做的一件事是添加间距:
strings = [‘do’, ‘re’, ‘mi’]
', '.join(strings)
‘do, re, mi’
通过在我们的连接字符串中添加一个空格,我们大大提高了输出的可读性。在加入字符串以提高可读性时,您应该始终牢记这一点。
.join()很聪明,因为它将您的“joiner”插入到您想要加入的可迭代的字符串之间,而不是仅仅在可迭代的每个字符串的末尾添加您的joiner。这意味着,如果您传递 size 的迭代1,您将看不到您的加入者:
‘b’.join([‘a’])
‘a’
练习:“部分理解检查”显示隐藏
使用我们的网页抓取教程,您已经构建了一个很棒的天气抓取工具。但是,它会在列表列表中加载字符串信息,每个列表都包含要写出到 CSV 文件的唯一信息行:
[
[‘Boston’, ‘MA’, ‘76F’, ‘65% Precip’, ‘0.15 in’],
[‘San Francisco’, ‘CA’, ‘62F’, ‘20% Precip’, ‘0.00 in’],
[‘Washington’, ‘DC’, ‘82F’, ‘80% Precip’, ‘0.19 in’],
[‘Miami’, ‘FL’, ‘79F’, ‘50% Precip’, ‘0.70 in’]
]
您的输出应该是如下所示的单个字符串:
“”"
Boston,MA,76F,65% Precip,0.15in
San Francisco,CA,62F,20% Precip,0.00 in
Washington,DC,82F,80% Precip,0.19 in
Miami,FL,79F,50% Precip,0.70 in
“”"
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注:Python)
24879)]
[外链图片转存中…(img-ufwvJ1sa-1713790024880)]
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注:Python)