继上一篇的数据类型和运算符,本文主要是字符串的基本内容:创建字符串
在 python 中,字符串的变量类型显示为str。你可以使用双引号"或单引号'定义字符串。
字符串在代码编写中经常使用,理解起来比较容易,所以在此只总结平时经常出错的一部分内容:1)虽然可以使用单引号或双引号创建字符串,但是只能二选一,不能一边是单引号一边是双引号; 2)引用字符串时,两个引号的中间部分为一个完整的字符串,如果在字符串中间出现引号,比如字母is的缩写's,就需要用\'替代单独的‘
#可以尝试下面的代码
Sentens = 'Jack\'s skateboard is in the garage.'
3)字符串是可以进行多种操作的,比如两个字符串相加、相乘
>>> first_word = 'Hello'
>>> second_word = 'There'
>>> print(first_word + second_word)
HelloThere
>>> print(first_word + ' ' + second_word)
Hello There
>>> print(first_word * 5)
HelloHelloHelloHelloHello
2.python字符串的索引
按位置索引时需要注意python索引从0开始,比如运行如下代码时出现的结果是:
>>> first_word = 'Hello'
Hello
>>> first_word[0]
H
>>> first_word[1]
e使用案例下面函数输入是字符格式的文件,输出为矩阵和类标签向量 #其他的部分暂时先不看,跟字符处理相关的可以注意到有以下几个方面 1)len用于读取字符串的长度 2)readlines是按行读取 3)strip用于删除字符串中指定的内容,本文strip()指定内容为空, 则是删除空白符(包括\n,\t,\r,'')) 4)split()通过对指定的分隔符对字符串切片,本文指定了\t则是在文本中tap键处的字符 进行分割 5)字符串索引,如上文我们说的一样,从0开始,而最后一个字符串用-1即可
鼓励大家尝试把自己的文本文件作为输入数据,按照自己的规则修改下面的代码,输出自己需要内容。
def file2matrix(filename):
fr = open(filename)
numberOfLines = len(fr.readlines()) #得到文件的行数
returnMat = zeros((numberOfLines,3)) #创建以0填充的numpy矩阵
classLabelVector = [] #准备一个空字符储存label
fr = open(filename)
index = 0
for line in fr.readlines():
line = line.strip()
listFromLine = line.split('\t')
returnMat[index,:] = listFromLine[0:3]
classLabelVector.append(int(listFromLine[-1]))
index += 1
return returnMat,classLabelVector
下次我们开始了解python的数据结构,明天见同志们。