# -*- coding: utf-8 -*- # python中的string可以用单引号或双引号来定义 str1 = 'There is a cat on the floor' str2 = "The cat wants to catch a mouse" # 如果字符串中出现单引号或双引号,需要在引号前面加反斜杠/ str3 = 'He/'s a teacher' # 用ord将字符转化为ASCII码 print ord('a') # 用chr将ASCII码转化为字符 print chr(ord('a') + 1) # 字符串的索引 print "abcdefgh"[3] # 可以用负数索引,相当于倒数第几个字符 print "abcdefgh"[-2] # 使用:得到子字符串 print "abcdefgh"[1:5] # 如果冒号前后不加位置,则到最前或最后 print "abcdefgh"[:5], "abcdefgh"[5:] # 还可以在第三个参数上加上步长 print "abcdefgh"[0:8:2] # 步长还可以是负数,相当于reverse() print "abcdefgh"[::-1] # 将字符串变为字符list x = list("abcdefgh") print x # 将字符list变为string print ''.join(x) # 将数字变成字符串的三种方法 x = 12345 print 'number:' + str(x) print 'number:' + repr(x) print 'number:' + `x` # 将字符串变成数字 print eval('2.99') + 0.01 # 可以用 + 连接两个字符串 print str1 + str2 # 字符串长度 print len(str1) # 字符串的查找 print str1.find('he') # 逆向查找 print str1.rfind('he') # 字符串的替换 print str1.replace('he', 'zz') # 将字符串分隔为token,存储在一个list结构中 tokens = str1.split() for i in tokens: print i # 将token list组合成字符串,中间用逗号隔开 str4 = ','.join(tokens) print str4 # 继续将其分隔开 print str4.split(',') # 中文字符的输出,需要加上开头第一行,否则会发生错误 print '你好' # 如果有多个分隔符,请用正则表达式 # 使用正则表达式首先需要导入模块 import re # 然后使用compile()编译得到正则表达式对象 # 假设我们的分隔符是xx和yy regex_delimiter = re.compile('xx|yy') # 然后可以正则表达式的split方法得到token print regex_delimiter.split('adfaxxdsafyydsaxxsd') # 正则表达式另一个常用函数findall,可用于匹配某类字符串 # 假设我们需要匹配数字 regex_delimiter = re.compile('[0-9.]+') print regex_delimiter.findall('height:173cm weight:100.0kg')