python 数据类型详解

最新推荐文章于 2024-06-22 10:30:53 发布

努力的Zane

最新推荐文章于 2024-06-22 10:30:53 发布

阅读量433

点赞数

文章标签： python

本文链接：https://blog.csdn.net/weixin_45503796/article/details/115007682

版权

前言

1.可变类型和不可变类型

python的数据都是报存在内存里的，python里的数据分为可变类型和不可变类型

不可变类型：字符串，数字，元组
可变类型：列表，字典，集合

不可变数据类型，如果修改值，地址不会发生变化，可变数据类型则会。

使用内置函数 id() 可以获取一个变量的内存地址。

一：字符串

1. 表示方式

a = 'hello'
b = "hello1"
c = '''hello2'''
d = """hello3"""

m = 'xiaoming said:"I am xiaoming"'
n = "I'm xiaoming"
p = """xiaoming said
"I 
am what I am"
"""

转义字符：\
print('good \t you') # good	  you

# 在字符串前面加 r 在python里表示是原生字符串
print(r'hello \t each')   # hello \t each

2. 下标和切片

下标（索引）：表示第几个数据。

切片：就是从字符串里复制一段指定的内容，形成新的字符串。

m = 'abcdefghijklmn'

# 获得指定下标
print(m[5])

# 获得切片  
# 语法：m[start:end:step]  
# （左闭右开）包含start不包含end
# step 指的是步长，理解为间隔。每隔 step-1 个取一次
# step 为负数，表示从右往左获取

print(m[4:7])

3. 常见操作

获取长度：len
查找内容：find, index, rfind, rindex
判断：startswith, endswith, isalpha, isdigit, isalnum, isspace
计算出现次数：count
替换内容：replace
切割字符串：split, rsplit, splitlines, partition, rpartition
修改大小写：capitalize, title, upper, lower
空格处理：ljust, rjust, center, lstrip, rstrip, strip
字符串拼接：join

注意：

在python中，字符串是不可变的！所有的字符串相关方法，都不会改变原有的字符串，都是返回一个结果，是一个新的返回值。

4. 字符串前加（u、r、b、f）

r/R
表示非转义的原始字符串，比如在字符串中如果出现\n是换行，但是如果在字符串的前面添加r则表示\和n两个字符，一般常见于正则表达式中。

b
Python3里默认的str是(Python2里的)unicode, bytes是(Python2)的str, b前缀代表的就是bytes。 Python2里, b前缀没什么具体意义，只是为了兼容Python3的这种写法。
作用：b" "前缀表示：后面字符串是bytes 类型。

u/U
表示unicode字符串，不是仅仅是针对中文, 可以针对任何的字符串，代表是对字符串进行unicode编码。一般英文字符在使用各种编码下, 基本都可以正常解析, 所以一般不带u；但是中文, 必须表明所需编码, 否则一旦编码转换就会出现乱码。建议所有编码方式采用UTF-8。

作用：后面字符串以 Unicode 格式进行编码，一般用在中文字符串前面，防止因为源码储存格式问题，导致再次使用时出现乱码。

f/F

f-string: formatted string literals, 格式化字符串常量。

f-string在本质上并不是字符串常量，而是一个在运行时运算求值的表达式。

以大括号 {} 标明被替换的字段

功能同str.format() %-formatting,
较两者更简洁易用，推荐使用
需要注意的是，Python3.6及以后的版本可用。

name = 'tom'
print(f'你好，{name}‘)
# 你好，tom
      
list_ = [1,2,3]
print(list_, f'has a length of {len(list_)}.')
# [1,2,3] has a length of 3.

print(list_, f'has a length of {{len(list_)}}.')
# [1,2,3] has a length of {len(list_)}.

print(list_, f'has a length of {{{len(list_)}}}.')
# [1,2,3] has a length of {3}.

5. 字符集和编码

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-n61AsRBC-1616139080393)(C:\Users\17812\Desktop\笔记(work)]\typora_images\image-20201201204528919-1616134896670.png)

使用内置函数 chr 和 ord 能够查看数字和字符的对应关系

# ord 获取字符对应的编码  chr 根据编码获取对应的字符
print(ord('a')) # 字符对应的编码是 97
print(chr(65)) # A

使用字符串的encode方法，可以将字符串转换成为指定编码集结果

print('你'.encode('gbk'))

7. 格式化字符串

格式化打印字符串

# 可以使用 % 占位符来表示格式化一个字符串
name = 'zhangsan'
age = 18
print('大家好，我是%s，我今年%d岁了', %(name,age) )

%s 表示的是字符串的占位符
%d 表示整数的占位符
%nd 打印时，显示 n 位，如果不够，在前面使用空格补齐
%f 表示的浮点数的占位符
%.nf 保留小数点后 n 位
%x 将数字使用十六进制输出

print('%%s')  # 打印：%s

format方法

# 使用 {} 进行占位，{}里可以加东西
print('大家好，我是{}，今年{}岁'.format('zhansan', 11))

print('大家好，我是{1}，今年{0}岁'.format(11, 'zhangsan'))
      
print('大家好，我是{name}，今年{age}岁'.format(age=11, name='zhangsan'))

print('大家好，我是{name}，今年{0}岁'.format(11,name='zhangsan'))

d = ['zhangsan', 11]
print('大家好，我是{}，今年{}岁'.format(*d))

info = {'name':'zhangsan', 'age':11}
print('大家好，我是{name}，今年{age}岁'.format(**info))

二：列表

1.认识列表

创建列表

# 使用 []
names = ['zhangsan', 'tom', 'mike']

# list(可迭代对象)
names = list(('tom', 'mike', 'tony'))# ('tom', 'mike', tony')是元组

列表特点

可以使用下标来获取元素和对元素进行切片。
可以使用下标来修改列表里的元素。
可以存储任意数据类型。

方法

添加：append()
插入：insert()
拼合：extend(可迭代对象)
删除：
- pop ：删除列表里最后一个数据，并且返回这个数据，还可以传入index参数，用来删除指定位置上的数据
- remove ：删除指定数据，如果数据在列表中不存在则报错
- clear ：清空列表
查询：
- index() ：查询指定数据的索引
- count()：查询指定数据在列表中的个数
- 使用 in 运算符时，返回布尔值

tanks = ['zhangsan', 'jiszh']
print('zhangsan' in tanks) # True

修改：通过下标直接修改。如：tanks[1] = 'lisi'

2.列表的操作

列表的遍历

while循环遍历

peoples = ['tom','mike','jack','jimy']
i = 0
while i < len(peoples):
	print(peoples[i])
    i += 1

for…in 循环遍历：for…in 循环的本质就是不断地调用next方法查找下一个数据。

peoples = ['tom','mike','jack','jimy']
for p in peoples:
	print(p)

列表的排序

sort()：调用列表的sort方法可以直接对列表进行排序。
- 加参数 reverse=True 可以反转排序。

nums = [1,2,3,5,4]
nums.sort()
nums.sort(reverse=True)
nums[::-1] # 也能实现反转排序

sorted()：内置函数，不会改变原有的列表数据，会生成一个新的有序列表数据。

x = sorted(nums)

reverse()：调用列表的reverse()方法可以反转排序。
当排序的元素是字典时：

students = [{'name':'jack','age':18},{'name':'tom', 'age':10}]

del fool(e):
    print('e = {}'.format(e)) 
    # 结果：
    # e = {'name':'jack','age':18}
    # e = {'name':'tom','age':10}
    return e['age'] # 告诉sort方法，按照元素的哪个属性进行排序。

# 需要传递参数key指定比较规则，key的类型是函数。
students.sort(key=fool)
# 在sort内部实现的时候，调用了fool函数，并且传入了一个参数，就是这里列表里的每一个元素。

总结：
students.sort(key=lambda e: e['age'])

列表的复制

x = [1,6,9,4,2,7]

y = x # 等号是内存地址的赋值，x,y指向同一个内存空间，会相互影响。这不是深拷贝也不是浅拷贝。

# 调用copy()方法，可以复制一个列表，这个新列表和原有列表内容一样，但指向不同的内存空间（地址不同）。
y = x.copy()

# 除了使用列表自带的copy()之外，还可以使用copy模块来实现拷贝。
import copy
a = copy.copy(x)

以上两种copy()都属于浅拷贝（内容一样，地址不同）。切片就属于一种浅拷贝。

深拷贝，只能使用copy模块来实现。copy.deepcopy()。深拷贝的结果是两个完全独立的对象，没有羁绊。

import copy

words = ['hello','hi','good','bye',[1,2,3],'go']

words1 = words.copy() # words1是words的浅拷贝。
# 浅拷贝认为只拷贝了一层，内部其他层的指向没有拷贝。
words[0] = '你好' # 这时words1不受影响。
words[4,0] = 5 # 这时words1跟着变了。

words2 = copy.deepcopy(words2) # 深拷贝，words 和 words2完全独立不相干。

求列表里的最大数

方法一：先排序，再取出最大数。
方法二：a = 其中任一数，再与其他数比较，将较大值赋给a，最终得到最大值a。

删除列表里的空字符串

没有现成的方法，只能自己实现。

列表的嵌套

列表是可以嵌套的。等同于多维数组。

列表推导式

作用：使用简单语法创建一个列表

nums = [i for i in range(10)]
nums = [i for i in range(10) if i % 2 == 0]

points = [(x,y) for x in range(10) for y in range(10,20)] # 列表里面是元组。

三：元组

用来保存数据。
用一对小括号()来表示一个元组。
元组和列表的区别：
- 列表是可变的，元组是不可变数据类型。

words = ['hello','he','me'] # 列表，使用[] 表示
nums = (1,2,3,4,5) # 元组，使用()表示
nums[2] = 4 # 会报错，元组是不可变数据类型。

和列表一样，是一个有序的存储数据的容器，可以通过下标来获取元素。

nums[2]  # 3

查询方法：调用元组里的方法
- index()
- count()：查询指定元素出现的次数。
特殊情况：

如何表示只有一个元素的元组？
age = (18) # 这种书写方式，age是一个整数，并不是一个元组。
age = (18,) # 加个逗号，就可以表示一个元组。

元组和列表之间转换

words = ['hello','he','me'] 
nums = (1,2,3,4,5)

num = tuple(words) # 列表转换为元组
word = list(nums) # 元组转换为列表

四：字典

1.认识字典

使用背景：列表的缺点。

# 定义一个列表保存：姓名、性别、职业。
nameList = ['xiaoZhang','男','木匠']

# 当修改职业的时候，需要记忆元素的下标。
nameList[2] = '花匠'

# 如果列表的顺序发生了变化：添加年龄。
nameList = ['xiaoZhang',18,'男','木匠']

# 此时需要记忆新的下标，才能完成职业的修改。
nameList[3] = '铁匠'

字典特点：

数据以键值对（key-value）保存的：不仅可以保存值，还能对值进行描述。
- key：不可重复的，重复则覆盖。只能使用不可变数据类型。
- value：可以使用任意数据类型。
使用 {} 来表示一个字典。key和value之间用冒号：连接。多个键值对之间用逗号，分隔。
字典是可变数据类型。
字典保存数据时是无序的。即不能通过下标获取元素。

2.字典的操作

字典内部提供了一系列方法供我们使用：

查询

person = {'name':'zhangsan', 'age':18}

person['name'] # 1.使用key获取对应的value值。

person.get('name') # 2.使用字典里的get()方法，如果获取的key不存在，不报错，而是	返回默认值（None）。
person.get('gender','felmare') # 可以这样设定默认值。

person.keys() # 获取所有的key
person.values() # 获取所有的value

修改、添加数据

person['name'] = 'lisi' # 直接使用Key可以修改对应的value。
person['gender'] = 'felmare' # 如果key不存在，则操作为往字典里添加一个新的键值对。

删除

person.pop('name') # 使用字典里的 pop()方法。返回值是被删的key对应的value。

person.popitem() # 字典里的 popitem()：删除一个元素，返回值是被删的键值对。

person.clear() # 字典里的 clear()：清空字典所有元素。

update()

person1 = {'name':'hh','age':11}
person2 = {'addr':'shanghai','gender':'man'}

person1.update(person2) # 可以将两个字典拼在一起。

字典的遍历

person = {'name':'zhangsan', 'age':18,'addr':'shanghai','gender':'man'}

# 方式一：
for x in person:
    print(x, '=', person[x])
   
# 方式二：
for k,v in person.items(): # 字典里的items()方法：返回一个列表，字典的每个键值对 对应列表的每个元组。
    print(k,'=',v)

3.字典推导式

dict1 = {'a':100, 'b':200, 'c':300}
dict2 = {v:k for k,v in dict1.items}

四：集合

1.认识集合

集合（set）是一个无序的不重复元素序列，可以使用大括号{} 或者 set() 函数创建集合。

注意：创建一个空集合必须使用 set() 而不是{} ，因为{} 是用来创建一个空字典。

特点：

无序不重复：如果有重复的数据，会自动去除，不会报错。

2.操作

内部方法

add() ：添加一个元素。
pop()：删除一个元素。
remove()：删除一个指定元素。
union()：将多个集合合并成一个新的集合。
update()：将一个集合拼到另一个集合里。
clear()

集合里运算符的使用：

first = {'aa','bb','cc','dd'}
second = {'aaa','bbb','ccc','ddd'}
third = {'a','b','c','d'}

# 不支持 +
first - second  # 求first和second的差集。
first & second # 求交集。
first | second # 求并集。
first ^ second # 求两者差集的并集。