第6章 序列:字符串、列表和元组(2)

string 模块预定义的字符串:

PythonWin 2.7.1 (r271:86832, Nov 27 2010, 18:30:46) [MSC v.1500 32 bit (Intel)] on win32.
Portions Copyright 1994-2008 Mark Hammond - see 'Help/About PythonWin' for further copyright information.
>>> import string
>>> string.uppercase
'ABCDEFGHIJKLMNOPQRSTUVWXYZ'
>>> string.ascii_letters
'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'
>>> string.lowercase
'abcdefghijklmnopqrstuvwxyz'
>>> string.digits
'0123456789'
>>>

for循环的else语句是一个可选项,它只在for循环完整的结束,没有遇到break时执行。

>>> x = [1,2,3,4,5]

>>> for item in range(0, len(x)):
... print x[item]
... else:
... print "The last value of item is ", item
...
1
2
3
4
5
The last value of item is 4
>>>

2. 连接符(+)

字符串的join():

>>> ''.join(('1','2','3','4'))
'1234'
>>>

3. 编译时字符串连接

Python的语法允许你在源码中把几个字符串连在一起写,以此来构建新的字符串。通过这种方法可以把长的字符串分成几部分写,而不用加反斜杠。这种写法的好处是可以把注释加进来。

>>> foo = "Hello" " " "World" "!"
>>> foo
'Hello World!'
>>>

4. 普通字符串转化为Unicode字符串。

如果把一个普通字符串和一个Unicode字符串做连接处理,Python会在连接操作前先把普通字符串转化为Unicode字符串。

重复操作符包含了原有字符串的多个拷贝的新串。

>>> "Anders!!!" * 3
'Anders!!!Anders!!!Anders!!!'

6.4 只适用于字符串的操作符

6.4.1 格式化操作符(%)

Python支持两种格式的输入参数:第一种是元组,第二种是字典形式。

>>> "%s %s" % ("Anders", "Fan")
'Anders Fan'
>>> "%(Anders)s %(Fan)s" % {"Anders":"Anders", "Fan":"Fan"}
'Anders Fan'
>>>

6.4.2 字符串模版:更简单的替代品

新式的字符串模版的优势是不用去记住所有相关细节的,Template对象有个方法substitute()。

>>> from string import Template
>>> s = Template("There are ${HowMany} ${Lang}!")
>>> print s.substitute(HowMany = "100M", Lang = "Money")
There are 100M Money!
>>> print s.substitute(HowMany = '2', Lang = 'brothers')
There are 2 brothers!
>>>

6.4.3 原始字符串操作符(r/R)

在原始字符串里,所有字符都是直接按照字面意思来使用,没有转义字符或不能打印的字符。

>>> '\n'
'\n'
>>> print '\n'

>>> r'\n'
'\\n'
>>> print r'\n'
\n
>>>

6.4.4 Unicode字符串操作符(u/U)

u/U用来把标准字符串或者包含Unicode字符的字符串转换成完全的Unicode字符串对象。

Unicode操作符必须出现在原始字符串操作符的前面。

>>> u'abc'
u'abc'
>>> u'\u1234'
u'\u1234'
>>> u'abc\u1234\n'
u'abc\u1234\n'
>>> print u'abc'
abc
>>> ur'Hello \n World!'
u'Hello \\n World!'
>>>

6.5 内建函数

6.5.1 标准类型函数

cmp():根据字符串的ASCII码值进行比较。

>>> cmp("abc", "lmn")
-1
>>> cmp("xyz", 'abc')
1
>>> cmp('lmn', 'lmn')
0
>>>

6.5.2 序列类型函数

len() 返回字符串的字符数

>>> len(string.letters)
52

max() and min()

返回最大或者最小字符

>>> max(string.digits)
'9'
>>> min(string.digits)
'0'
>>>

enumerate()

>>> s = "Anders Fan"
>>> for item, value in enumerate(s):
... print item, ' ', value
...
0 A
1 n
2 d
3 e
4 r
5 s
6
7 F
8 a
9 n
>>>

zip()

>>> first, second = "Anders", "Fan "
>>> zip(first, second)
[('A', 'F'), ('n', 'a'), ('d', 'n'), ('e', ' '), ('r', ' '), ('s', ' ')]
>>>

6.5.3 字符串类型函数

raw_input():提示用户输入并将这个输入返回。

str() and unicode()函数都是工厂函数,产生相对应的类型的对象。

isinstance()函数判断一个对象的类型。

chr()函数用一个range(256)范围内的整数做参数,返回一个对应的字符。

unichr()函数跟chr()一样,返回的Unicode字符。

ord()函数是chr()函数或unichr()函数的配对函数,它以一个字符作为参数,返回对应的ASCII数值,或者Unicode数值。

>>> chr(123)
'{'
>>> unichr(123)
u'{'
>>> ord('A')
65
>>> ord(u'\u1234')
4660
>>>


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值