Python的字符串
字母与对应的数字转换函数ord()和chr()
>>> ord('A')
65
>>> chr(65)
'A'
字符编码与相关函数
以Unicode表示的字符串用u’…’表示,比如:
>>> print u'开车'
开车
>>> u'开车'
u'\uf00\u8f66'
把Unicode转换成utf-8函数encode(‘utf-8’)以及反转函数decode(‘utf-8’)等相关函数len():
Unicode转换成utf-8函数用法如下:
>>> u'ABC'.encode('utf-8')
'ABC'
>>> u'中国'.encode('utf-8')
'\xe4\xb8\xad\xe5\x9b\xbd'
Unicode转换成utf-8反转函数用法如下:
>>> u'中国'.encode('utf-8')
'\xe4\xb8\xad\xe5\x9b\xbd'
>>> len(u'中国')
2
>>> len( u'中国'.encode('utf-8'))
6
>>> u'中国'.encode('utf-8').decode('utf-8')
u'\u4e2d\u56fd'
>>> printf u'\u4e2d\u56fd'
File "<stdin>", line 1
printf u'\u4e2d\u56fd'
^
SyntaxError: invalid syntax
>>> print u'\u4e2d\u56fd'
中国
计算字符串长度函数:
>>> len(u'中国')
2
>>> len(u'abc')
3
>>> len('abc')
3
>>> a = 'Linux'
>>> len(a)
5
>>> len('\xe4\xb8\xad\xe5\x9b\xbd')
6
以下两行代码最好加在每个py文件头。
#!/usr/bin/env python
# -*- coding: utf-8 -*-
格式化
Python中格式化与C语言函数printf()比较相似。
举个栗子:
>>> 'HelloWorld %s %d' %('Linux', 100)
'HelloWorld Linux 100'
>>> 'your name is %s your age is %d' %('Wh0am1', 21)
'your name is Wh0am1 your age is 21'
>>> 'your name is %s' %'Wh0am1'
'your name is Wh0am1'
>>>