九.Python字符串操作

字符串

 

字符串基本特点

很多人初学编程时,总是担心自己数学不行,潜意识里认为数学好的才能变成.实际上,大多数程序员打交道最多的是"字符串"而不是"数字".因为,编程时用来解决现实问题的,因此逻辑思维的重要性远远超过数学能力.(个人感觉,上面一段话,虽然对,但是有些情况,比如说绘图的时候,需要计算曲线,比如说写一些底层工具类的时候,数学对编程帮助还是很大的,所以也有必要提升自己对算法的一些知识的了解)

 

字符串的本质是:字符序列.Python的字符串是不可变的,我们无法对原字符串做任何修改.但是,可以将字符串的一部分复制到新创建的字符串中,达到"看起来修改"的效果.

 

Python不支持单字符类型,单字符也是作为一个字符串使用的.

 

字符串的编码

Python3直接支持Unicode,可以表示世界上任何书面语言的字符.Python3的字符默认就是16位Unicode编码,ASCII码是Unicode编码的子集.

使用内置函数ord()可以把字符串转换成对应的Unicode码;

使用内置函数chr()可以把十进制数字转换成对象的字符.

引号创建字符串

我们可以通过单引号或双引号创建字符串.例如:a='abc',;b="def"

使用两种引号的好处是可以创建本身就包含引号的字符串,而不用使用转义字符.例如

连续三个单引号或三个双引号,可以帮助我们创建多行字符串.例如

 

空字符串和len()函数

Python允许空字符串的存在,不包含任何字符且长度为0.例如:

len()用于计算字符串含有多少个字符.例如:

 

转义字符

我们可以使用"\+特殊字符",实现某些难以用字符表示的效果.比如:换行等.常见的转义字符如下:

 

 

续行符\

 

字符串拼接

1.可以使用+将多个字符串拼接起来.例如:'aa'+'bb' => 'aabb'

如果+两边都是字符串,则拼接.

如果+两边都是数字,则加法运算.

如果+两边类型不同,则抛出异常(和Java不一样,不能数字直接与字符串拼接)

可以将多个字面字符串直接放到一起实现拼接.

 

字符串复制

 

使用*可以实现字符串复制

 

不换行打印

我们前面调用print时,会自动打印一个换行符.有事,我们不想换行,不想自动添加换行符,我们可以自己通过参数 end='任意字符串',实现尾部添加任何内容;

 

从控制台读取字符串

我们可以使用input()从控制台读取键盘输入的内容.

将其它类型转成字符串

str()实现数字类型转型字符串

 

str()可以帮助我们将其他类型的数据转为字符串.例如

当我们调用print()函数是,解释器自动调用了str()将非字符串的对象转成了字符串.

 

使用[]提取字符

字符串的本质就是字符序列,我们可以通过在字符串后面加[],在[]里面指定偏移量,可以提取该位置的某个字符.

正向搜索:

最左侧第一个字符,偏移量是0,第二个偏移量是1,依次类推,直到len(str)-1为止

反向搜索:

最右侧第一个字符,偏移量是-1,倒数第二个偏移量是-2,依次类推,直到-len(str)为止

 

 

replace()实现字符串替换

字符串是"不可改变"的,我们可以通过[]可以获取字符串指定位置的字符,但是我们不能改变字符串,当我们尝试改变字符串中某个字符,会报错

 

字符串不可改变,但是,我们确实有时候需要替换某些字符.这时,只能通过创建新的字符串来实现

整个过程中,实际上我们是创建了新的字符串对象,并指向了变量a,而不是修改了以前的字符串.内存图如下:

 

字符串切片slice操作

 

切片slice操作可以让我们快速的提取字符串,标准格式为:

[起始偏移量start : 终止偏移量 end : 步长 step]

典型操作(三个量为整数的情况)如下:

 

切片操作是,起始偏移量和终止偏移量不在[0,字符串长度-1]这个范围,也不报错.起始偏移量小于0则会当做0,终止偏移量大于 "长度-1"会被当成-1.

 

split()分割和join()合并

split()可以基于指定分隔符将字符串分隔成多个子字符串(存储到列表中).如果不指定分隔符,则默认使用空白字符(换行符/空格/制表符).实例如下:

 

join()的作用和split()作用刚好相反,用于将一系列子字符串连接起来.实例代码如下

 

拼接字符串要点:

使用字符串拼接福+,会生成新的字符串对象,因此不推荐使用+来拼接字符串.推荐使用join函数,因为join函数在拼接字符串之前会计算所有字符串的长度,然后逐一拷贝,仅新建一次对象

 

字符串驻留机制和字符串比较

 

字符串驻留:仅保留一份相同且不可变字符串的方法,不同的值呗存放在字符串驻留池中.

Python支持字符串驻留机制,对于符合标识符规则的字符串(仅包含下划线(_),字母和数字)会启用字符串驻留机制.

字符串比较和同一性

我们可以直接使用==,!=对字符串进行比较,是否含有相同的字符.

我们使用is/not is,判断两个对象是否同一对象.比较的是对象的地址,即id(obj1)是否和id(obj2)相等.

 

成员操作符

in/not in关键字,判断某个字符(子字符串)是否存在于字符串中

 

字符串常用方法汇总

 

字符串有很多常用的方法,我们需要熟悉,我们可以将这些方法汇总起来,方便大家查阅.希望大家针对每个方法都做一次测试.

 

常用查找方法

len(str):字符串长度

str.startwith("内容"):判断字符串收以内容开头

str.endwith("内容"):判断字符串收以内容结尾

str.find('value')第一次出现value字符串的位置

str.rfind('value')最后一次出现value字符串的位置

str.count("value"):指定字符串出现了几次

str.islnum():所有字符全是字母或数字

 

去除首尾信息

我们可以通过strip()去除字符串首尾指定信息,通过lstrip()去除字符串左边指定信息,restrip()去除字符串邮编指定信息.

 

大小写转换

变成中关于字符串大小写转换的情况,经常遇到,下面是整理的方法

str.capitalize():产生新的字符串,首字母大写

stra.title():产生新的字符串,每个单词都首字母大写

str.upper():产生新的字符串,所有字符全部转成大写

str.lower():产生新的字符串,所有字符全转成小写

str.swapcase():产生新的字符串,所有字符大小写转换

 

格式排版

center(),ljust(),rjust().这三个函数对于字符串实现排版:

参数(size,[char])

将字符串扩容到size长度,其余使用char进行填充

 

其它字符串常用函数:

isalnum()是否为字母或数字

isalpha() 检测字符串是只由字母组成(或汉字)

isdigit() 检测字符串是否只由数字组成

isspace()检测字符串是否为空白符

isupper()是否为大写字母

islower()是否为小写字母

 

 

字符串的格式化

 

format()基本用法

Python2.6开始,新增了一种格式化字符串的函数str.format(),它增强了字符串格式化的功能.

 

基本语法是通过{}和 :来代替以前的%

format函数可以接受不限个参数,位置可以不按照顺序.

 

PyCharm和IDLE效果不太一样,不过使用方式差不多

我们可以通过{索引}/{参数名},直接映射参数值,实现对字符串的格式化,非常方便

 

填充与对齐

填充常跟对齐一起使用

^.<.>分别是居中,左对齐,右对齐,后面带宽度

:号后面带填充的字符,只能是一个字符,不指定的话默认是用空格填充

{1: ^8}

 

数字格式化

浮点数通过f,整数通过d进行需要的格式化,

 

其它格式化方法

 

 

可变字符串

在Python中,字符串属于不可变对象,不支持原地修改,如果需要修改其中的值,智能创建新的字符串对象,但是,经常我们确定需要原地修改字符串,可以使用io.StringIO对象或array模块

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值