python语言中的基本数据类型及其特性_python基本数据类型

知识内容:

1.python对象模型

2.数字与bool

3.字符串

4.列表与元组

5.字典与集合

一、python对象模型

1.python对象模型

对象是python语言中最基本的概念,在python中的所有的一切都可以称为对象。python中有许多内置对象供开发者使用,例如数字、字符串、列表、字典、集合等等,还有大量的内置函数(前面提到的print()和type())

2.python内置对象

1259476-20180307172822777-659046150.png

1259476-20180307172907123-1541438789.png

3.可变、不可变数据类型和hash

(1)可变数据类型和不可变数据类型

python中的数据类型可以分为可变数据类型和不可变数据类型

可变数据类型: 列表、字典、集合(set)

不可变数据类型: 数字、字符串、元组

从内存角度看列表和数字的变与不变:

1 >>> l = [1, 2, 3, 4]2 >>>id(l)3 84221264

4 >>> l[1] = 1.5

5 >>>id(l)6 84221264

7 >>>l8 [1, 1.5, 3, 4]9 >>> print("列表是可变数据类型")10 列表是可变数据类型11 >>> a = 1

12 >>>id(a)13 494523440

14 >>> a = 3

15 >>>a16 3

17 >>>id(a)18 494523472

19 >>> print("数字是不可变类型")20 数字是不可变类型

列表中某项赋新值之后id值未变,在内存上还是原来的列表,所以说列表是可变类型,而数字赋新值后id发生了改变说明数字是不可变类型

字符串是不可变类型

1 >>> s = 'hello'

2 >>> s[1] = 'a'

3 Traceback (most recent call last):4 File "", line 1, in

5 TypeError: 'str' object does notsupport item assignment6 >>> s = 'hello'

7 >>>id(s)8 58865760

9 >>> s += 'python'

10 >>>s11 'hellopython'

12 >>>id(s)13 58886128

字符串可以向列表一样使用索引操作,但是不能像修改列表一样来修改字符串的值,当我们对字符串进行拼接时,原理和整数一样,id值已经发生了改变,

相当于变成了另一个字符串,所以说字符串也是一个不可变类型

元组-不允许修改值,也是不可变类型

1 >>> t = (1, 2, 3, 4)2 >>> t[1] = 1.5

3 Traceback (most recent call last):4 File "", line 1, in

5 TypeError: 'tuple' object does not support item assignment

(2)hash

hash的定义: Hash,一般翻译做“散列”,是把任意长度的输入,通过散列算法,变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,所以不可能从散列值来确定唯一的输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数

特征: hash值的计算过程是依据值的特征来计算,这就要求被hash的值必须固定,也就是说被hash的值必须是不可变的

注: 可变类型不可hash,不可变类型可hash

应用: 文件签名、MD5加密、密码验证

1 >>> hash("你猜我是谁")2 1186796725

3 >>> hash("wyb")4 1957863783

5 >>> hash((1,2,3))6 -378539185

二、数字

1.数字属于不可变对象

修改整形变量值的时候并不是真的修改这个变量的值而是先把值存放到内存中,然后修改变量使其指向新的内存地址,浮点数、复数等数字类型以及其他类型的变量均具有同样的特点

示例:

1 x = 3

2 print(id(x))3 x = 5

4 print(id(x))5

6 #id(): 返回一个整数,代表变量在内存中的地址

7 #以上两个id返回的值明显不一样,说明变量值的地址是不一样的

2.数字可以表示任意大的数值

在python中数字可以表示任意大的数值,在命令行中测试如下:

1259476-20180307180103667-2005765194.png

3.数字类型

(1)int(整数)

整数可以分为十进制数、十六进制数、八进制数、二进制数,十进制数就是普通的整数,十六进制数以0x或0X开头,八进制数以0o或0O开头,二进制数以0b或0B开头

注: 在python2中整数分为int和long两种,但是在python3中只有int一种

(2)float(浮点数)

浮点数用来处理实数,即带有小数的数字。类似于C语言中的double类型

注: 浮点数的取值范围和精度一般无限制,但是浮点数运算可能存在误差,也就是可能有不确定尾数

ContractedBlock.gif

ExpandedBlockStart.gif

1 >>> 0.1+0.2

2 0.30000000000000004

3 >>> 0.1+0.2 == 0.3

4 False5 >>> round(0.1+0.2)==0.3

6 False7 >>> round(0.1+0.2, 1)==0.3

8 True

不确定尾数

(3)complex(复数)

复数由实数部分和虚数部分组成,一般形式为x+yj,其中的x是复数的实数部分,y是复数的虚数部分,这里的x和y都是实数

示例:

ContractedBlock.gif

ExpandedBlockStart.gif

1 x = 2 #整数

2 print(type(x))3 y = 3.6 #浮点数

4 print(type(y))5 c = 3 + 4j #复数

6 print(type(c))7 print(c.real) #复数的实部

8 print(c.imag) #复数的虚部

9

10 #输出结果:

11 #

12 #

13 #

14 #3.0

15 #4.0

View Code

数字类型其他相关操作:

ContractedBlock.gif

ExpandedBlockStart.gif

1 #数据类型 - Numbers

2

3 #python3 支持int、float、bool、complex(复数)这些Numbers类型

4

5 #int类型:

6 a = 33333333333333333333333333333333333333333333333333

7 print(type(a))8

9 #float类型:

10 a = 3.333333333333333333333333333333333333333333333333

11 print(type(a))12

13 #bool类型: True\False

14 a =True15 print(type(a))16

17 #complex(复数)类型:

18 a = 87 + 3j

19 print(type(a))20

21

22 #Numbers有关的操作符:

23 #算术操作符: + - * / % ** // not > < == >= <=

24 #比特操作符: ~ & | ^ >> <<

25

26 a = 2

27 b = 3

28

29 #算术操作符: + - * / % ** // not > < == >= <=

30 print("a = 2")31 print("b = 3")32 print("a+b =", a+b)33 print("a-b =", a-b)34 print("a*b =", a*b)35 print("a/b =", a/b) #真正的除法

36 print("a%b =", a % b) #求余数

37 print("a**b =", a**b) #乘方

38 print("a//b =", a//b) #地板除法(去掉小数位)

39 print("not a =", not a) #取反

40 print("a==b =", a == b) #判等

41 print("a>b =", a >b)42 print("a=b =", a >=b)44 print("a<=b =", a <=b)45

46 #比特操作符: ~ & | ^ >> <<

47 #~: 按二进制取反;按照补码规则,结果数字为-(A+1)

48 #&: 并操作: 只有两个比特位都为1时结果中的对应比特位才设为1,否则设为0

49 #|: 或操作: 只要两个比特位有一个为1,结果中的对应比特位设为1,否则设为0

50 #^: 异或操作:如果两个比特位相同则结果中的相应比特位设为0,否则设为1

51 #>>:按比特位右移

52 #<<:按比特位左移

53

54 #并 - 或 - 异或的比特位操作如下所示:

55 #A B &(并) |(或) ^(异或)

56 #0 0 0 0 0

57 #0 1 0 1 1

58 #1 0 0 1 1

59 #1 1 1 1 0

60

61 a = ~30 #按二进制取反,结果为-31

62 b = 3 & 3 #二进制并操作,结果为3

63 c = 3 & 1 #二进制并操作,结果为1

64 d = 3 ^ 1 #二进制异或操作,结果为2

65 e = 3 << 1 #二进制按比特位左移操作,结果为6

66

67 print(a)68 print(b)69 print(c)70 print(d)71 print(e)72

73

74 #和Numbers类型有关的的内置函数:

75 #(1)通用函数:

76 #str(A) --> 将参数转换成可显示的字符串

77 #type(A) --> 返回参数的类型对象

78 #bool(A) --> 将参数转换成bool类型

79 #int(A) --> 将参数转换成int类型

80 #float(A) --> 将参数转换成float类型

81 #complex(A)--> 将参数转换成complex类型

82

83 #(2)数值类型特定函数:

84 #abs(A) --> 取绝对值

85 #divmod(A,B)-->除模操作: 生成一个元祖,形式为(A/B,A%B)

86 #pow(A,B) --> 幂操作符: 结果为"A的B次方"

87 #round(A) --> 返回参数的四舍五入结果

88 #hex(A) --> 将A转换成用十六进制表示的字符串

89 #oct(A) --> 将A转换成用八进制表示的字符串

90 #chr(A) --> 将A转换成ASCII字符,要求0<=A<=255

91 #ord(A) --> chr(A)的反函数

View Code

4.bool(布尔型)

bool型在python中有两个值: True(真)和False(假),两者值分别为1和0,主要用来做逻辑判断

1 >>> a = 3

2 >>> b = 5

3 >>> a > b #不成立就是False,即假

4 False5 >>> a < b #成立就是True,即真

6 True

三、字符串

1.字符串的表示

(1)用单引号、双引号或三引号括起来的符号系列称为字符串, 并且单引号、双引号、三单引号、三双引号可以互相嵌套,用来表示复杂字符串

1 "wyb", 'Hello, World', "python", '''Tom said, "Let's go"'''都是字符串

(2)空串表示为'', ""

1 #下面是空串:

2 msg = ''

3 name = ""

(3)三引号表示的字符串可以换行,支持排版较为复杂的字符串;三引号还可以在程序中表示较长的注释

1 msg = '''

2 我是谁3 我在哪4 我在干什么5 '''

6 print(msg)  # 字符串换行

1 '''

2 三引号中可以写多行注释3 这里可以写多行注释4 '''

(4)不加引号的字符串会被系统认为是变量

1 >>> name =jack2 Traceback (most recent call last):3 File "", line 1, in

4 NameError: name 'jack' is notdefined5 >>> jack = "wyb"

6 >>> name =jack7 >>>name8 'wyb'

2.字符串的常用操作

(1)字符串拼接:

+: 直接将两个字符串相加 *: 字符串复制多次

join(seq) 以指定字符串作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串

1 >>> name = "wyb"

2 >>> age = "21"

3 >>> name +age4 'wyb21'

5 >>> name*3

6 'wybwybwyb'

1 >>>''.join("python")2 'python'

3 >>>'123'.join("python")4 'p123y123t123h123o123n'

注: 字符串只能与字符串进行拼接,不能与其他数据类型一起拼接!

1 >>> name = "wyb"

2 >>> age = 21

3 >>> name +age4 Traceback (most recent call last):5 File "", line 1, in

6 TypeError: must be str, not int

(2)大小写:

capitalize() 将字符串的第一个字符转换为大写

swapcase() 将字符串中大写转换为小写,小写转换成大写

upper() 转换字符串中所有小写字母为大写

lower() 转换字符串中所有大写字符为小写

title() 返回"标题化"的字符串,就是说所有单词都是以大写开始,其余字母均为小写

1 >>> s = "python web framework"

2 >>>s.capitalize()3 'Python web framework'

4 >>>s5 'python web framework'

6 >>>s.upper()7 'PYTHON WEB FRAMEWORK'

8 >>>s.lower()9 'python web framework'

10 >>>s.title()11 'Python Web Framework'

12

13 >>> s = "ABCDefg"

14 >>>s.swapcase()15 'abcdEFG'

(3)字符串填充:

center(width, fillchar) 返回一个指定的宽度 width 居中的字符串,fillchar 为填充的字符,默认为空格

ljust(width[, fillchar]) 返回一个原字符串左对齐,并使用 fillchar 填充至长度 width 的新字符串,fillchar 默认为空格。

rjust(width,[, fillchar]) 返回一个原字符串右对齐,并使用fillchar(默认空格)填充至长度 width 的新字符串

zfill (width) 返回长度为 width 的字符串,原字符串右对齐,前面填充0

1 >>> s = "python"

2 >>> s.center(20, '*')3 '*******python*******'

4 >>> s.ljust(10, '*')5 'python****'

6 >>> s.rjust(10, '*')7 '****python'

8 >>> s.zfill(10)9 '0000python'

(4)数值计算:

len(string) 返回字符串长度

count(str, beg= 0,end=len(string)) 返回 str 在 string 里面出现的次数,如果 beg 或者 end 指定则返回指定范围内 str 出现的次数,str可以是一个字符也可以是多个字符

1 >>> s = "python"

2 >>>len(s)3 6

4 >>> s = "111222abcdefga"

5 >>> s.count(1)6 Traceback (most recent call last):7 File "", line 1, in

8 TypeError: must be str, notint9 >>> s.count('1')10 3

11 >>> s.count('1111')12 013 >>> s.count('111')14 1

15 >>> s.count('a')16 2

(5)查找:

find(str, beg=0 end=len(string)) 检测 str 是否包含在字符串中,如果指定范围 beg 和 end ,则检查是否包含在指定范围内,如果包含返回开始的索引值,否则返回-1

rfind(str, beg=0,end=len(string)) 类似于 find()函数,不过是从右边开始查找

index(str, beg=0, end=len(string)) 跟find()方法一样,只不过如果str不在字符串中会报一个异常 rindex( str, beg=0, end=len(string)) 类似于 index(),不过是从右边开始

max(str) 返回字符串 str 中最大的字母 min(str)返回字符串 str 中最小的字母

1 >>> s = "this is a string"

2 >>> s.find('str')3 10

4 >>> s.rfind('str')5 10

6 >>> s.index('str')7 10

8 >>> s.rindex('str')9 10

10 #查找的子串不在字符串中:

11 >>> s.find('adsfasd')12 -1

13 >>> s.index('adsfasd')14 Traceback (most recent call last):15 File "", line 1, in

16 ValueError: substring notfound17 >>> max("python")18 'y'

19 >>> min("python")20 'h'

(6)判断字符串:

isalnum() 如果字符串至少有一个字符并且所有字符都是字母或数字则返 回 True,否则返回 False

isalpha() 如果字符串至少有一个字符并且所有字符都是字母则返回 True, 否则返回 False

isdigit() 如果字符串只包含数字则返回 True 否则返回 False..

islower() 如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False

isnumeric() 如果字符串中只包含数字字符,则返回 True,否则返回 False

isspace() 如果字符串中只包含空白,则返回 True,否则返回 False.

istitle() 如果字符串是标题化的(见 title())则返回 True,否则返回 False

isupper()  如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是大写,则返回 True,否则返回 False

isdecimal() 检查字符串是否只包含十进制字符,如果是返回 true,否则返回 false。

startswith(str, beg=0,end=len(string)) 检查字符串是否是以 obj 开头,是则返回 True,否则返回 False。如果beg 和 end 指定值,则在指定范围内检查

endswith(suffix, beg=0, end=len(string)) 检查字符串是否以 obj 结束,如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束,如果是,返回 True,否则返回 False

(7)映射:

maketrans()创建字符映射的转换表,对于接受两个参数的最简单的调用方式,第一个参数是字符串,表示需要转换的字符,第二个参数也是字符串表示转换的目标。

translate(table, deletechars="") 根据 str 给出的表(包含 256 个字符)转换 string 的字符, 要过滤掉的字符放到 deletechars 参数中

1 >>>table = ''.maketrans("abcdef123", "uvwxyz@#$")2 >>>s = "python is a good programming language"

3 >>>s.translate(table)4 'python is u goox progrumming lunguugy'

(8)替换:

replace(old, new [, max])把字符串中的 old替换成 new,如果 max 指定,则替换不超过 max 次

1 >>> s = "python is a good language"

2 >>> s.replace('a', '666')3 'python is 666 good l666ngu666ge'

4 >>>s5 'python is a good language'

6 >>> s.replace('a', '666', 1)7 'python is 666 good language'

8 >>>s9 'python is a good language'

(9)字符串分割:

split(str="", num=string.count(str)) 以str分割字符串最多分割num个,num默认为str在字符串中的个数,返回一个列表

rsplit(str="", num=strring.count(str)) 也是以str分割字符串最多分割num个,num默认为str在字符串中的个数,返回一个列表,不过rsplit()是从右边开始分割

splitlines([keepends]) 按照行('\r', '\r\n', '\n')分隔,返回一个包含各行作为元素的列表,如果参数 keepends 为 False,不包含换行符,如果为 True,则保留换行符。

partition() 和rpartition()都接收一个分割字符串作为参数,将目标字符串分割为两个部分,返回一个三元元组(head,sep,tail),包含分割符,partition()从左边开始分割,rpartition()从右边开始分割

1 >>> s = "adgsdfadgsdakhjidadfd"

2 >>> s.split('a')3 ['', 'dgsdf', 'dgsd', 'khjid', 'dfd']4 >>> s.rsplit('a')5 ['', 'dgsdf', 'dgsd', 'khjid', 'dfd']6 >>> s.split('a', 1)7 ['', 'dgsdfadgsdakhjidadfd']8 >>> s.rsplit('a', 1)9 ['adgsdfadgsdakhjid', 'dfd']10 >>> s.partition('a')11 ('', 'a', 'dgsdfadgsdakhjidadfd')12 >>> s.rpartition('a')13 ('adgsdfadgsdakhjid', 'a', 'dfd')

(11)去掉开头或结尾字符:

strip([chars]) 在字符串上执行 lstrip()和 rstrip()lstrip() 截掉字符串左边的空格或指定字符。rstrip() 删除字符串字符串末尾的空格

1 >>> s = "python"

2 >>>s.strip()3 'python'

4 >>>s5 'python'

6 >>>s.lstrip()7 'python'

8 >>>s.rstrip()9 'python'

(12)字符串转换

eval(): 将任意字符串转换成python表达式并求值

1 >>> eval("3+5")2 8

3 >>> eval("3**2")4 9

5 >>> eval("9")6 9

3.字符串的格式化

字符串格式化是指按规定的规则连接、替换字符串并返回新的符合要求的字符串,字符串格式化有以下两种方法:

(1)使用%进行格式化

语法格式:

"%[-][+][0][m][.n]格式字符" %x    # []中的为可选

解释:

第一个%: 格式标志,表示格式开始

-: 指定左对齐输出

+: 对正数加正号

0: 指定空位填0

m: 指定最小宽度

n: 指定精度

python中的格式字符:

1 %c 格式化字符及其ASCII码2 %s 格式化字符串3 %d 格式化整数4 %u 格式化无符号整型5 %o 格式化无符号八进制数6 %x 格式化无符号十六进制数7 %X 格式化无符号十六进制数(大写)8 %f 格式化浮点数字,可指定小数点后的精度9 %e 用科学计数法格式化浮点数10 %E 作用同%e,用科学计数法格式化浮点数11 %g %f和%e的简写12 %G %f 和 %E 的简写13 %p 用十六进制数格式化变量的地址

格式化输出:

1 name = input("name:")2 age = int(input("age:"))3 job = input("job:")4 hometown = input("hometown:")5

6 infos = """

7 ----------- info of %s ----------8 Name: %s9 Age: %d10 Job: %s11 Hometown: %s12 ---------- end ------------------13 """ %(name, name, age, job, hometown)14

15 print(infos)

(2)使用字符串的format方法进行格式化

更推荐使用formath方法,该方法不仅灵活,不仅可以使用位置进行格式化,还支持使用与位置无关的参数名字来进行格式化。并且支持序列解包格式化字符串,为程序员提供了极大的方便

用法: <模板字符串>.format(<逗号分割的参数>)

format 函数可以接受不限个参数,位置可以不按顺序,实例:

1 >>>"{} {}".format("hello", "world") #不设置指定位置,按默认顺序

2 'hello world'

3 >>> "{0} {1}".format("hello", "world") #设置指定位置

4 'hello world'

5 >>> "{1} {0} {1}".format("hello", "world") #设置指定位置

6 'world hello world'

format函数也可以进行数字的格式化,实例:

1 >>> print("{:.2f}".format(3.1415926))2 3.14

模板字符串中的格式控制:

1259476-20180404185615801-1532838841.png

1259476-20180404185714361-2020585546.png

1259476-20180404185837072-1281855854.png

示例:

ContractedBlock.gif

ExpandedBlockStart.gif

1 #(1)使用%的字符串格式化:

2 #format_string % string_to_convert

3 #format_string % (string_to_convert1,string_to_convert2,、、、)

4 #format_string为格式标记字符串,期中包括固定的内容和待替换的内容,

5 #待替换的内容用格式化符号标明;

6 #string_to_convert为要格式化的字符串,如果是两个以上,则需要用小括号括起来

7 print("my name is %s and my age is %d" % ("wyb", 21))8 #将charA的内容以字符形式替换在要显示的字符串中

9 print("ASCII码65代表: %c" %charA)10 #将charB的内容以数字形式替换在要显示的字符串中

11 print("ASCII码%d代表: B" %charB)12

13 #(2)format函数字符串格式化:

14 print("format函数字符串{}很好用".format('格式化'))15 print("format{} + {} + {}".format(1, 2, 3))

字符串格式化的两种方法

4.关于转义字符

(1)python支持的常用转义字符:

1259476-20180307184923404-1923449882.png

(2)需要特别注意:

在字符串界定符(也就是引号)前加上r或R表示原始字符串,其中的特殊字符不进行转义,但是字符串的最后一个字符不能是'\'符号。原始字符串主要用于正则表达式中,也可以用来简化文件路径或者url的输入

示例:

1 #__author__ = "wyb"

2 #date: 2018/3/7

3

4 path = 'C:\Windows\notepad.exe'

5 print(path) #字符\n被转义为换行符

6 path = r'C:\Windows\notepad.exe' #原始字符串,任何字符都不转义

7 print(path)8

9 #输出结果:

10 #C:\Windows

11 #otepad.exe

12 #C:\Windows\notepad.exe

四、列表与元组

1.列表的创建

(1)直接创建列表:

1 >>> L1 = [] #创建空列表

2 >>> L2 = [1, 2, 3] #创建一个普通列表

3 >>> L3 = [4, ["python", 'c']] #列表的嵌套定义

4 >>>

5 >>> L4 = list() #通过list()创建列表

6 >>> print(L1)7 []8 >>> print(L2)9 [1, 2, 3]10 >>> print(L3)11 [4, ['python', 'c']]12 >>> print(L4)13 []

(2)使用list()将元组、range对象、字符串或其他类型的可迭代对象的数据转换成列表

ContractedBlock.gif

ExpandedBlockStart.gif

1 #使用list()创建列表:

2 a_list = list((3, 5, 6, 7, 9))3 print(a_list)4 b_list = list(range(10))5 print(b_list)6 c_list = list('python')7 print(c_list)8

9 #输出结果:

10 #[3, 5, 6, 7, 9]

11 #[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

12 #['p', 'y', 't', 'h', 'o', 'n']

View Code

注: 关于range函数 原型: range([start, ]stop[, step])

第一个参数start表示起始,没有设置时默认表示从0开始(即从第一个开始), 第二个参数表示终止(结果中不含这个值),第三个参数表示步长(默认为1) , 该函数在python3中

返回一个range可迭代对象,而在python2中是返回一个包含若干整数的列表。

2.列表的基本操作

(1)查询(索引)

ContractedBlock.gif

ExpandedBlockStart.gif

1 #列表索引

2 name_list = ['wyb', 'zl', 'k']3 print(name_list[0]) #列表索引从0开始

4 print(name_list[1])5 print(name_list[-2]) #列表索引可以为负数表示从最后一个开始的倒数第几个

6

7 #输出结果:

8 #wyb

9 #zl

10 #zl

View Code

(2)追加: append() insert() extend()

ContractedBlock.gif

ExpandedBlockStart.gif

1 #列表追加: append() insert() extend()

2 name_list = ['wyb', 'zl', 'k']3 name_list.append('add') #将数据直接添加到最后

4 print(name_list)5 name_list.insert(0, 'first') #将数据添加到指定位置

6 print(name_list)7

8 #输出结果:

9 #['wyb', 'zl', 'k', 'add']

10 #['first', 'wyb', 'zl', 'k', 'add']

11

12

13 #append()与extend()的区别:

14 #list.append(object) 向列表中添加一个对象object

15 #list.extend(sequence) 把一个序列seq的内容一个个地添加到列表中

16 list_first = ['s', 'k', 'z']17 list_last = [1, 3, 9]18 list_first.append(list_last)19 print(list_first)20 list_a = ['sdf', 'sd', 'fff']21 list_b = ['123', '666', '333']22 list_a.extend(list_b)23 print(list_a)24

25 #输出结果:

26 #['s', 'k', 'z', [1, 3, 9]]

27 #['sdf', 'sd', 'fff', '123', '666', '333']

View Code

(3)删除: remove() pop() del()

ContractedBlock.gif

ExpandedBlockStart.gif

1 #列表删除: remove() pop() del()

2 a = ['a', 'b', 'c', 'd']3 a.remove(a[0])4 print(a)5 b = a.pop(1)6 print(a)7 dela[0]8 print(a)9 dela10 #print(a) # 删除a后这条语句将会报错

11

12 #输出结果:

13 #['b', 'c', 'd']

14 #['b', 'd']

15 #['d']

View Code

(4)修改

ContractedBlock.gif

ExpandedBlockStart.gif

1 #列表修改

2 list_one = [1, 2, 3]3 list_one[0] = 'wyb' #修改第一个元素

4 list_one[-1] = 'zl' #修改最后一个元素

5 print(list_one)6

7 #输出结果:

8 #['wyb', 2, 'zl']

View Code

(5)长度: len()

ContractedBlock.gif

ExpandedBlockStart.gif

1 #列表长度: len()

2 name_list = ['wyb', 'zl', 'k']3 print(len(name_list))4

5 #输出结果: 3

View Code

(6)循环

ContractedBlock.gif

ExpandedBlockStart.gif

1 #列表的多重循环

2 names = ['wyb', 'woz', 'jay']3 ages = [20, 21, 30]4 for name, age inzip(names, ages):5 print(name, age)6

7 #输出结果:

8 #wyb 20

9 #woz 21

10 #jay 30

View Code

(7)拷贝: copy() 列表深浅拷贝

ContractedBlock.gif

ExpandedBlockStart.gif

1 #列表拷贝

2 name_list = ['wyb', 'tim', 'tom', 'alex']3 name_copy =name_list.copy()4 print(name_copy)5

6 #输出结果: ['wyb', 'tim', 'tom', 'alex']

View Code

(8)统计: count()

ContractedBlock.gif

ExpandedBlockStart.gif

1 #列表统计

2 name_list = ['wyb', 'tim', 'tom', 'alex', 'tim']3 print(name_list.count('tim'))4

5 #输出结果: 2

View Code

(9)排序及翻转: sort() reverse()

ContractedBlock.gif

ExpandedBlockStart.gif

1 #列表排序及翻转

2 x = [4, 6, 2, 1, 7, 9]3 x.sort(reverse=True)4 print(x)5 a = ['wyb', 'jx', 'tm', 'tom', 'x', 'k']6 a.reverse()7 print(a)8 a = ['wyb', 'jx', 'tm', 'tom', 'x', 'k']9 a.sort()10 print(a)11

12 #输出结果:

13 #[9, 7, 6, 4, 2, 1]

14 #['k', 'x', 'tom', 'tm', 'jx', 'wyb']

15 #['jx', 'k', 'tm', 'tom', 'wyb', 'x']

View Code

(10)获取下标: index()

ContractedBlock.gif

ExpandedBlockStart.gif

1 #获取下标

2 name_list = ['wyb', 'tim', 'tom', 'alex', 'tim']3 print(name_list.index('wyb'))4 print(name_list.index('tom'))5 print(name_list.index('tim'))6

7 #输出结果:

8 #0

9 #2

10 #1

View Code

(11)切片:

1259476-20180407194941267-1406131672.png

3.元组

元组其实跟列表差不多,也是存一组数,只不是它一旦创建,便不能再修改,所以又叫只读列表

元组创建:

(1)直接创建元组:

name_tuple = ('wyb', 'xyz', 'k') 注: 如果要创建一个只包含一个元素的元组,需在这个元素后加上逗号","

(2)使用tuple()将其他类型转换成元组

char_tuple = tuple("abcdefg")

name_tuple = tuple(['wyb', 'xyz', 'k'])

元组的方法:

count() , index()

ContractedBlock.gif

ExpandedBlockStart.gif

1 #__author__ = "wyb"

2 #date: 2018/3/10

3

4 #在python语言中tuple的元素在初始化后不能修改

5 #开发时的常量一般可以存储在tuple中

6

7 t1 = (1, 2, "python", 8.88)8 #元组切片:

9 print(t1[1:])10 print(t1[0:5])11

12 #不能修改元组内容但是可以对元组变量重新赋值

13 t2 = (3, 'you and me')14 t1 = t1 +t215 print(t1)16

17

18 #元组里的数据不能被修改,所以又被叫做只读列表

19 tup = (1,) #一个元素,需要在元素后面添加逗号

20 tuple1 = (1, 2, 3) #三个元素

21 tuple2 = () #空元组

22

23 print(tuple1[1:3]) #元组切片

24

25 print(tuple1.count(1)) #元组的count()方法

26 print(tuple1.index(3)) #元组的index()方法

View Code

注:

(1)对于元组而言只能使用del命令删除整个元组对象,而不能单独删除元组中的部分元素,因为元组属于不可变序列

(2)虽然元组属于不可变序列,但是如果元组中的元素值为可变序列,则情况就发生了一点了改变,如下:

1 >>> x = ([0, 1], 3)2 >>>x3 ([0, 1], 3)4 >>> x[0][0] = 666

5 >>>x6 ([666, 1], 3)7 >>> x[0].append('3')8 >>>x9 ([666, 1, '3'], 3)

4.元组与列表的区别

(1)可变与不可变

列表是可变序列,可以对某个元素进行赋值修改,也可以随意地添加删除元素,而元组是不可变序列,不能对某个元素进行赋值修改,更不能随意地添加删除元素

(2)访问处理速度

元组地访问处理速度比列表更快,如果需要定义一系列常量,只是对它们进行遍历或其他类似用途,而不需要对其元素进行任何修改,那么一般建议使用元组

五、字典与集合

1.字典的定义

字典一种key - value 的数据类型,使用就像我们上学用的字典,通过笔划、字母来查对应页的详细内容

示例:

1 info ={2 'stu01': "ming",3 'stu02': "wyb",4 'stu03': "tom",5 }

2.字典的特性

字典是无序可变的序列

字典中每个元素包括两部分: 键(key)和值(value)

key必须可hash也就是必须为不可变的数据类型(数字、字符串),并且必须是唯一的

可存放任意多个值、可修改、可以不唯一

无序

3.字典相关操作

(1)增加及修改

ContractedBlock.gif

ExpandedBlockStart.gif

1 info ={2 'stu01': "ming",3 'stu02': "wyb",4 'stu03': "tom",5 }6

7 #字典增加

8 info['stu_add'] = "add_student"

9 print(info)10

11 #字典修改

12 info['stu_add'] = "修改"

13 print(info)14

15 #输出结果:

16 #{'stu01': 'ming', 'stu02': 'wyb', 'stu03': 'tom', 'stu_add': 'add_student'}

17 #{'stu01': 'ming', 'stu02': 'wyb', 'stu03': 'tom', 'stu_add': '修改'}

View Code

(2)删除

ContractedBlock.gif

ExpandedBlockStart.gif

1 #字典删除

2 info ={3 'stu01': "ming",4 'stu02': "wyb",5 'stu03': "tom",6 }7

8 info.pop('stu03')9 print(info)10 del info['stu01']11 print(info)12

13 #输出结果:

14 #{'stu01': 'ming', 'stu02': 'wyb'}

15 #{'stu02': 'wyb'}

View Code

(3)查找

ContractedBlock.gif

ExpandedBlockStart.gif

1 #字典查找

2 info ={3 'stu01': "ming",4 'stu02': "wyb",5 'stu03': "tom",6 }7

8 result = info.get('stu01')9 print(result)10 result = info.get('not') #即使key不存在也不会报错而是输出None

11 print(result)12 result = info['stu01'] #查找不存在的key就会报错

13 print(result)14

15 #结果:

16 #ming

17 #None

18 #ming

View Code

(4)多级字典嵌套及操作

ContractedBlock.gif

ExpandedBlockStart.gif

1 av_catalog ={2 "欧美":{3 "www.youporn.com": ["很多免费的,世界最大的","质量一般"],4 "www.pornhub.com": ["很多免费的,也很大","质量比yourporn高点"],5 "letmedothistoyou.com": ["多是自拍,高质量图片很多","资源不多,更新慢"],6 "x-art.com":["质量很高,真的很高","全部收费,屌比请绕过"]7 },8 "日韩":{9 "tokyo-hot":["质量怎样不清楚,个人已经不喜欢日韩范了","听说是收费的"]10 },11 "大陆":{12 "1024":["全部免费,真好,好人一生平安","服务器在国外,慢"]13 }14 }15

16 av_catalog["大陆"]["1024"][1] += ",可以用爬虫爬下来"

17 print(av_catalog["大陆"]["1024"])18 #ouput

19 ['全部免费,真好,好人一生平安', '服务器在国外,慢,可以用爬虫爬下来']

View Code

(5)循环

ContractedBlock.gif

ExpandedBlockStart.gif

1 #方法1

2 for key ininfo:3 print(key,info[key])4

5 #方法2

6 for k,v in info.items(): #会先把dict转成list,数据里大时莫用

7 print(k,v)

View Code

(6)其他:

dict(): 用于创建字典 具体使用: 点这里

update(): 将另一个字典里的键值对一次性全部添加到当前字典对象中

clear(): 一次性删除字典中所有元素

popitem(): 删除并返回字典中的一个元素

keys(): 返回字典中的所有键

values(): 返回字典中的所有值

setdefault(): 设置字典中的值

items(): 以列表返回可遍历的(键, 值) 元组数组

1 d1 = dict(name="woz", age=20, work="student")2 d2 = {1: 'python', 2: 'java', 3: 'ruby'}3 d1.update(d2)4 print(d1)5 print(d1.popitem())6 print(d1.popitem())7 print(d1.popitem())8 print(d1.keys())9 print(d1.values())10 print(d1.items())11 d1.setdefault("coding", "utf-8")12 print(d1)

4.集合

(1)集合的定义与分类

集合: 相互之间无序的一组对象集合,分为普通集合(通过set定义)和不可变集合(通过frozenset定义)

普通集合在初始化后支持并集补集交集,不可变集合初始化后就不能改变

1 #普通集合

2 s = {'wyb', 'zzz', 'xyz'}3 print(s)4 print(type(s))5 #不可变集合

6 k = frozenset({'asf', 'sdf', 'df'})7 print(k)8 print(type(k))

(2)集合特性

确定性: 元素必须可hash,必须为不可变元素

互异性(去重)

无序性: 元素没有先后之分,{1,2,3}和{3,2,1}算做同一个集合

(3)集合的作用

去重,把一个列表变成一个集合便会自动去重(集合中的元素是无序的,不可以有重复的对象,所以可以通过集合把重复的数据去除)

关系测试,测试两组数据之间的交集、差集、并集等关系

ContractedBlock.gif

ExpandedBlockStart.gif

1 #集合: 集合中的元素是无序的,不可以有重复的对象,所以可以通过集合把重复的数据去除

2 s = ['1', '2', '2']3 res =set(s)4 print(res)

集合去重

ContractedBlock.gif

ExpandedBlockStart.gif

1 #集合的关系运算

2 s1 = {'iphone', 'hw', 'honor', 'x'}3 s2 = {'vivo', 'jli', 'old_phone', 'x', 'hw'}4

5 #集合的交

6 print(s1.intersection(s2))7 print(s1 &s2)8

9 #集合的并

10 print(s1.union(s2))11 print(s1 |s2)12

13 #集合的差 -> 只在s1不在s2

14 print(s1.difference(s2))15 print(s1 -s2)16

17 #集合的对称差集 -> 只在s1或只在s2

18 print(s1.symmetric_difference(s2))19 print(s1 ^s2)20

21 #集合的包含关系

22 print(s1.isdisjoint(s2)) #判断两个集合是否相交

23 print(s1.issuperset(s2)) #判断集合是不是包含其他集合,等同于a>=b

24 print(s1.issubset(s2)) #判断集合是不是被其他集合包含,等同于a<=b

集合的关系运算

(4)集合的常用操作

单个元素的增加: add()

对序列的增加: update()

删除: discard() remove() pop() clear()

ContractedBlock.gif

ExpandedBlockStart.gif

1 #集合的操作符:

2 #in, not in, ==, != , <, <=, >, >=, &, |, -, ^, |=, &=, -=, ^=

3 #in: 判断包含关系

4 #not in: 判断不包含关系

5 #==: 判断等于

6 #!=: 判断不等于

7 #<: 判断绝对子集关系

8 #<=:判断非绝对子集关系

9 #>:判断绝对超集关系

10 #>=:判断非绝对超集关系

11 #-:差运算

12 #集合的操作符的示例:

13 mylist = [4, 6, -1, 'English', 0, 'python']14 s1 =set(mylist)15 s2 = frozenset([6, 'English', 9])16 print(6 in s1) #判断包含关系

17 print(s1 >= s2) #判断子集关系

18 print(s1 - s2) #差运算

19 print(s1 & s2) #交运算

20 print(s2)21

22 #普通集合(set类型)的内置函数:

23 #add(): 增加新元素

24 #update(seq): 用序列更新集合,序列的每个元素都被添加到集合中

25 #remove(element): 删除元素

26 #集合(set类型)的内置函数的示例:

27 mylist = [4, 6, -1.1, 'English', 0, 'python']28 sample1 =set(mylist)29 sample1.add('China')30 print(sample1)31 sample1.update('France')32 print(sample1)33 sample1.remove(-1.1)34 print(sample1)

集合的操作符及常用操作

补充内容:

1. 切片

切片是Python序列的重要操作之一,适用于列表、元组、字符串、range对象

语法: start:stop:step 第一个数字表示切片开始位置(默认为0),第二个参数表示切片停止位置(默认为列表长度且不包括),第三个数字表示切片的步长,当步长省略时可以顺便省略最后一个冒号与使用下标访问列表元素的方法不同,切片操作不会因为下标越界而抛出异常,而是简单地在列表尾部截断或返回一个空列表,代码具有更强的健壮性

以列表为示例:

1 >>> list = [3, 4, 5, 6, 7, 8, 9, 10, 11, 12]2 >>> list[::] #从头到尾全部输出

3 [3, 4, 5, 6, 7, 8, 9, 10, 11, 12]4 >>> list[::-1] #从尾到头全部输出

5 [12, 11, 10, 9, 8, 7, 6, 5, 4, 3]6 >>> list[::2] #从头到尾每隔2个就输出

7 [3, 5, 7, 9, 11]8 >>> list[1::2] #从第二个元素开始一直到结尾每隔2个就输出

9 [4, 6, 8, 10, 12]10 >>> list[3::] #从第四个到结尾全部输出

11 [6, 7, 8, 9, 10, 11, 12]12 >>> list[3:6] #从第四个到第六个全部输出

13 [6, 7, 8]14 >>> list[3:6:1] #从第四个到第六个全部输出

15 [6, 7, 8]16 >>> list[0:100:1] #从头到尾全部输出

17 [3, 4, 5, 6, 7, 8, 9, 10, 11, 12]18 >>> list[100:] #下标越界返回空列表

19 []

2.用于序列操作的常用内置函数

(1)len():  返回列表、元组、字典、集合、字符串、range对象等各种可迭代对象的元素个数

(2)max(), min():  返回列表、元组、字符串、集合、range对象、字典等的最大或最小元素,要求所有元素之间可以进行大小比较,另外对字典进行操作时默认是对字典的键进行计算,要对字典值进行计算,则需要使用字典对象的values()方法明确说明

(3)sum():  对数值型列表、数值型元组、集合、range对象、字典等进行计算求和

1 #__author__ = "wyb"

2 #date: 2018/3/12

3

4 s = [1, 2, 3, 6, 9, 8]5 print(len(s))   #s中元素的个数

6 print(max(s))   #s中元素的最大值

7 print(min(s))   #s中元素的最小值

8 print(sum(s))   #s中元素的和

9 print(sum(s)/len(s)) #s的平均值

(4)zip(列表1, 列表2, 、、、):  将多个列表或元组对应位置的元素组合为元组,并返回包含这些元组的列表(python2)或zip对象(python3)

1 >>> a = [1, 2, 3]2 >>> b = [4, 5, 6]3 >>> c = [7, 8, 9]4 >>> d =zip(a, b, c)5 >>>d6

7 >>>list(d)8 [(1, 4, 7), (2, 5, 8), (3, 6, 9)]

(5)enumerate(列表):  枚举列表、元组、字符串、字典或其他可迭代对象的元素,返回枚举对象,枚举对象中每个元素是包含下标和元素值的元组

1 >>> for index, value in enumerate("python"):2 ... print(index, value)3 ...4 0 p5 1y6 2t7 3h8 4o9 5n10 >>> for i, v in enumerate({1:"d", 2:"s", 3:"k"}):11 ... print(i, v)12 ...13 0 1

14 1 2

15 2 3

16 >>> for i, v in enumerate({1:"d", 2:"s", 3:"k"}.values()):17 ... print(i, v)18 ...19 0 d20 1s21 2 k

(6)sorted(): 对列表、元组、字典进行排序,并借助其key参数来实现更复杂的排序

内置函数sorted()返回新的列表、元组或字典,不对原来的列表、元组或字典做任何修改

sorted()原型:

1 sorted(iterable, key=None, reverse=False)

sorted函数排序默认升序, 可以设置key值来解决一些特殊的需求,reverse=False表示升序排列,reverse=True表示降序排列

3.列表推导式

列表推导式使用非常简洁的方式来快速生成满足特定需求的列表,代码具有非常强的可读性,例如:

1 a = [x*x for x in range(10)]

上面的代码等价于:

1 a =[]2 for x in range(10):3 a.append(x*x)

列表推导式:

ContractedBlock.gif

ExpandedBlockStart.gif

1 #__author__ = "wyb"

2 #date: 2018/3/12

3

4 ## 以下3段代码等价:

5 #f = [' banana ', ' loganberry ', ' passion fruit ']

6 #a = [w.strip() for w in f]

7 #print(a)

8 #9 #f = [' banana ', ' loganberry ', ' passion fruit ']

10 #for i, v in enumerate(f):

11 #f[i] = v.strip()

12 #print(a)

13 #14 #f = [' banana ', ' loganberry ', ' passion fruit ']

15 #f = list(map(str.strip, f))

16 #print(a)

View Code

4.序列解包

在实际开发中,序列解包是非常重要和常用的一个语法,可以使用非常简洁的形式完成复杂的功能,大幅度提高了代码的可读性,并且减少了程序员的代码输入量。

例如可以使用序列解包功能对多个变量同时赋值:

1 >>> x,y,z = 1,2,3

2 >>> print(x,y,z)3 1 2 3

列表与字典的序列解包:

1 >>> a = [1, 2, 3]2 >>> b, c, d =a3 >>> print(b, c, d)4 1 2 3

5 >>> s = {1:'a', 2:'b', 3:'c'}6 >>> b, c, d = s #对键进行操作

7 >>> print(b, c, d)8 1 2 3

9 >>> b, c, d = s.values() #对值进行操作

10 >>> print(b, c, d)11 a b c12 >>> b, c, d = s.items() #对键和值操作

13 >>> print(b, c, d)14 (1, 'a') (2, 'b') (3, 'c')

使用序列解包可以同时遍历多个序列:

1 >>> keys = [1, 2, 3, 4]2 >>> values = ['a', 'b', 'c', 'd']3 >>> for k, v inzip(keys, values):4 ... print(k, v)5 ...6 1a7 2b8 3c9 4 d

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 假设我们要读取的.txt文件名为data.txt,其每行都是一个数字,我们可以使用以下Python代码: ```python with open('data.txt', 'r') as f: numbers = [int(line.strip()) for line in f] numbers.sort(reverse=True) second_largest = numbers[1] print("Second largest number is:", second_largest) ``` 首先使用`open`函数打开文件,并使用`with`语句来确保文件在使用完毕后被正确关闭。然后使用列表推导式读取每行数据并将其转换为整数类型,并将它们存储在一个名为`numbers`的列表。 接着,我们对`numbers`列表进行排序(从大到小),并将第二个元素(即第二大的数字)存储在`second_largest`变量。 最后,我们输出第二大的数字。 ### 回答2: 假设有一个名为data.txt的文本文件,其包含一列数字,每个数字占一行。我们可以使用Python代码读取该文件,并找出其的第二个最大值。 首先,我们需要打开文件并读取数据。使用open()函数打开文件,并使用readlines()方法将文件内容读取到一个列表。 ``` file = open("data.txt", "r") lines = file.readlines() ``` 接下来,我们需要将每一行的数据转换为整数类型,并将其存储在一个新的列表。 ``` data = [] for line in lines: number = int(line.strip()) data.append(number) ``` 然后,我们可以使用内置的sort()方法对数据列表进行排序,以找出最大值和第二个最大值。排序后的列表的最后两个元素即为最大值和第二个最大值。 ``` data.sort() second_largest = data[-2] ``` 最后,我们可以打印出第二个最大值。 ``` print("第二个最大值为:", second_largest) ``` 完整代码如下: ``` file = open("data.txt", "r") lines = file.readlines() data = [] for line in lines: number = int(line.strip()) data.append(number) data.sort() second_largest = data[-2] print("第二个最大值为:", second_largest) ``` 上述代码将从data.txt文件找到第二大值。请确保将data.txt文件放在与代码相同的目录,并且文件的每个数字应占一行。 ### 回答3: 下面是一个示例的Python代码,可以读取一个.txt文件的数据,并找出其的第二个最大值: ```python # 打开.txt文件 file = open("data.txt", "r") # 读取文件的所有数据,并将每行数据转换为整数 data = [int(line.strip()) for line in file.readlines()] # 关闭文件 file.close() # 判断数据长度 if len(data) < 2: print("数据不足,请至少提供两个数值") else: # 初始化最大值和第二个最大值 max_value = max(data[0], data[1]) second_max = min(data[0], data[1]) # 遍历数据,找出第二个最大值 for num in data[2:]: if num > max_value: second_max = max_value max_value = num elif num > second_max: second_max = num # 输出第二个最大值 print("第二个最大值为:", second_max) ``` 你需要将代码的"data.txt"替换为你要读取的.txt文件的路径。另外,请确保.txt文件的每行只包含一个数值。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值