Python之字符串

字符串基本特点

        字符串的本质是:字符序列。Python的字符串是不可变的,我们无法对原字符串做任何修改。但,可以将字符串的一部分复制到新创建的字符串,达到“看起来修改”的效果。

Python不支持单字符类型选,单字符也是作为一个字符串使用的。


字符串的编码

        Python3直接支持Unicode,可以表示世界上任何书面语言的字符。Python3的字符默认就是16为编码的Unicode编码,ASCⅡ是Unicode编码的子集。所以一个汉字在Unicode编码中表示的长度是1。

        使用内置函数ord()可以把字符转成对应Unicode码。

        使用内置函数chr()可以把十进制数字转换成对应的字符。


引号创建字符串

        我们可以通过单引号或双引号创建字符串。例如:

       可以通过使用两种引号创建本身就包含引号顶点字符串,而不使用转义字符。例如:

       连续三个单引号或三个双引号,可以帮助我们创建多行字符串。例如


空字符串和len()函数

        Python允许空字符串的存在,不包含任何字符且长度为0。len()用于计算字符串含有多少字符。例如:


转义字符

        我们可以使用"\+特殊字符",实现某些难以用字符表示的效果。例如:换行等。常见的的注意字符如下:

转义字符描述
\(在行尾时)续行符
\\反斜杠符号
\'单引号
\*双引号
\b退格(Backspace)
\n换行
\t横向制表符
\r回车


字符串拼接

        1.可以使用+号将多个字符串拼接起来。例如:

                (1)如果+两边都是字符串,则拼接

                (2)如果+两边都是数字,则加法运算

                (3)如果+两边类型不同,则抛出异常

       2.可以将多个字符串直接放在一起拼接,例如:

         注意:在字符串拼接中,+两边可以是字符串或变量,而直接放在一起拼接只能是字符串不能是变量。


字符串赋值

        可以使用*实现字符串复制,可以复制字符串,也可以复制指向字符串的变量。 例如:


不换行打印

        在前面调用print时,会自动打印一个换行符。有事,我们不想换行,不想自动添加换行符。我们可以自己通过参数end="任意字符串"。实现末位想添加任何内容:

         在源文件中:

       运行结果:


 从控制台读取字符串

        我们可以使用input()从控制台读取键盘输入的内容。在input()括号中的可以设置字符串,作为输入提示信息:


str()实现数字转型字符串

        str()可以帮助我们将其他数据类型转换为字符串例如:

       当我们调用print()函数是,解释器自动调用了str()将非字符对象转成了字符串。


使用[]提取字符串

        字符串的本质是字符序列,我们可以通过在字符串后面添加[],在[]里面指定偏移量,可以提取单个字符串。

        正向搜索:

                最左侧的第一字符,偏移量是0,第二个偏移量是1,一次类推。直到len(str)-1为止。

        反向搜索:

                最右侧第一字符,偏移量是-1.倒数第二个是-2,以此类推,直到-len(str)为止。


repalce()实现字符串替换

        字符串是“不可改变“”的,我们可以通过[]可以获取字符串指定位置的字符,但我们不能改变字符串。我们尝试改变字符串中的某个字符串,发现报错了:

         字符串不可改变。但是,我们的确有时候需要替换某些字符。这时,只能通过创建新的字符串来实现。

·


        整个过程中,实际上我们是创建了新的字符串对象, 而变量a指向的字符串对象并没有改变。但如果将新的字符串对象指向变量a,变量a引用的对象发生了改变。内存图如下:


字符串切片slice操作

        切片slice操作可以让我们快速的提取子字符串。标准格式为:

                [起始偏移量 start:终止偏移量 end:步长 step]
        
        典型操作(三个数为正数的情况下):
操作和说明示例结果
[:]        提取整个字符串"abcdef"[:]"abcdef"
[start:]从头开始直到end-1"abcdef"[2:]"cdef"
[:end]从头开始直到end-1"abcdef"[:2]"ab"
[start:end]从start到end-1"abcdef"[2:4]"cd"
[start:end:step]从start提取到end-1,步长是step

"abcdef"[1:5:2]

"bd"

        其它操作(三个量为负数)的情况:

示例说明结果
"abcdefghijklmnopqrstuvwxyz"[-3:]
倒数第三个"xyz"
"abcdefghijklmnopqrstuvwxyz"[-8:-3]倒数第八个到倒数第三个(包头不包尾)"stuvw"
"abcdefghijklmnopqrstuvwxyz"[::-1]步长为负,从右到左反向提取
'zyxwvutsrqpon
mlkjihgfedcba'

        切片操作时,起始偏移量和终止偏移量不在[0:字符串长度-1]这个范围,也不会报错。例如:

        1.将"to be or not to be"字符串倒序输出

        2.将"sxtsxtsxtsxtsxt"字符串中所有的 s 输出


split()分割和join()合并

        split()可以基于指定分割符将字符分隔成多个子字符串(存储到列表中)。如果不指定分割符,则默认使用空白字符(换行符/空格/制表符)。示例代码如下:

         join()的作用和split()作用刚好相反,用于将一系列子字符串(列表)连接起来(字符串)。示例代码如下:

        字符串拼接要点:

        使用字符传拼接符+,会产生新的字符串对象,因此不推荐使用+来拼接字符串。推荐使用join函数,因为join函数在拼接字符串之前按会计算所有字符串的长度,然后逐一拷贝,仅新建一次对象。

        测试+拼接符和join(),不同的效率:

        运行结果:


 字符串驻留机制和字符串比较

         字符串驻留:仅保存一份相同且不可变字符串的方法,不同的值被存放在字符串驻留池中。Python支持字符串驻留机制,对于符合要要求的字符串(仅包含下划线(_)、字母、数字)会启用字符串驻留机制。

         字符串驻留发生在compile_time,而不是run_time。


字符串比较和同一性

        我们可以直接使用==,!=对字符串进行比较,是否含有相同的字符。

        我们使用is/ not is,判断两个对象是否同一个对象。比较的是对象的地址,即id(obj1)是否和id(obj2)相等。


成员操作符号

        in / not in 关键字,判断某个字符串(子字符串)是否存在与字符串中。


 字符串常用方法

        字符串有很多常用的方法,我们需要熟悉。


常用查找方法

        以一段文本作为测试:

        a='我叫彭XX,今年20,我在JXUST大学读书。我们没有女朋友,xdm都出去陪女朋友,而我只能敲代码,哇,为什么,同样是人,为什么我还要敲代码!算了,我还是得敲,老子好好学习,卷死它们,不说了,敲代码去了!'

   

方法和使用示例说明结果
len(a)字符串长度102
a.startswith('我叫彭XX')以指定字符串开头True
a.endswith('敲代码去了!')以指定字符串结尾True
a.find('彭')第一次出现指定字符串的位置2
a.rfind('了')最后一次出现指定字符串的位置100
a.count('为什么')指定字符串出现了几次2
a.isalnum()所有字符全是字母或数字False


去除首尾信息

        我们可以通过strip()去除字符串首尾指定信息。通过lstrip()去除字符串左边指定信息,rstrio()去除字符串右边指定信息。


大小写转换

        编程中关于字符串大小写转换的情况,经常遇见。相关方法汇总如下:

        设定一个测试变量:

        a="Phh is 'single'"

示例说明结果
a.capitalize()产生新的字符串,首字母大写"Phh is 'single'"
a.title()产生新的字符串,每个单词都首字母大写"Phh Is 'Single'"
a.upper()产生新的字符串,所有字母全转成大写"PHH IS 'SINGLE'"
a.lower()产生新的字符串,所有字符全转成小写"phh is 'single'"
a.swapcase()产生新的字符串,所有字母大小写转换"pHH IS 'SINGLE'"


格式排版

        center()、ljust()、rjust()这三个函数用于对字符串实现排版。


其它方法

方法说明
isalnum()是否为字母或数字
isalpha()检测字符串是否只含字母(包括汉字)
isdigit()检测字符串是否只由数字组成
isspace()检测是否为空字符串(或者说是否全为空格)
issupper()是否为大写字母
islower()是否为小写字母


字符串的格式化

format()基本用法

         Python2.6 开始,新增一种格式化字符串函数str.format(),它增强了字符串格式化的功能。

        基本语法是通过{}和:来代替以前的%。

        format()函数可以接受不限个参数,位置可以不按顺序。

        参数格式:'{[index][:[fill] align][sign][#][width][.precision][type]} {……}{……} '.format()

        以上参数的意义是:
        注意,格式中的[ ]内的参数都是可选参数,可以使用也可以不使用。

        index:指定冒号:后面除出现的参数在formart()中的索引值,如果没有,则按format()中的默认顺序分配。

        fill:指定空白处的填充符号,默认为空白填充。

        align:指定数字的对齐方式。

align参数含义
<right-aligned 左对齐(对于大部分对象时为默认)
>right-aligned 右对齐 (对于数字时为默认)
=数据右对齐,同时将符号放置在填充内容的最左侧,该选项只对数字类型有效
^数据居中,此选项需和 width 参数一起使用

        

        

        sign:指定有无符号数。

sign参数含义
+正数前面添加 ‘ + ’ ,负数前面加 ‘ - ’
-正数前面不添加 ‘ + ’ ,负数前面加 ‘ - ’
space正数前面添加 ‘ 空格 ’ ,负数前面加 ‘ - ’
#对于二进制数、八进制数和十六进制数,使用此参数,各进制数前会分别显示 0b、0o、0x前缀;反之则不显示前缀

        width:指定输出数据时所占的宽度

        precision:如果后面存在type参数,则指的是保留小数的位数,

                              如果type参数不存在,则是指有效数字的位数

        type:指定输出数据的具体类型

type参数含义
s对字符串类型格式化
d十进制整数
c将十进制整数转换成对应的Unicode字符
e or E转换成科学计数法后,再格式化输出
g or G指定在e和f或(E和F)中切换
b将十进制自动转换成二进制表示,再格式化输出
o将十进制自动转换成八进制表示,再格式化输出
x or X将十进制自动转换成十六进制表示,再格式化输出
f or F转换成浮点数(默认小数点后6为),再格式化输出
%显示白百分比(默认显示小数点后6位)

 可变字符串

        在Python中,字符串属于不可变对象,不支持原地修改,如果需要修改其中的值,智能创建新的字符串对象。但是,经常我们的确需要原地修改字符串,可以使用io.StringIO对象或array模块。

 

 实操作业

1.从控制台输入用户的月薪,进行运算计算出年薪。打印输出用户的年薪

 2.使用字符串复制,用计算机打印出“爱你一百遍”,打印 100 次

 

 3.判断如下输出结果,并文字解释原因:

        >>> a = "abd_33"
        >>> b = "abd_33"
        >>> c = "dd#"
        >>> d = "dd#"
        >>> a is b         #输出 true or false?
        >>> c is d         #输出 true or false?
        字符串驻留机制
4. 写出如下代码打印的结果:
        >>> c = "名字是{name},年龄是{age}"
        >>> c.format(age=19,name='phh')
 
'名字是phh,年龄是19'

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值