Python 之数据类型

奔跑的大西吉

已于 2023-01-18 23:23:12 修改

阅读量1.1k

点赞数 2

分类专栏： Python 文章标签： python

于 2019-12-18 11:00:33 首次发布

本文链接：https://blog.csdn.net/fenglepeng/article/details/103587293

版权

Python 专栏收录该内容

77 篇文章 11 订阅

订阅专栏

文章收集于网络，如有版权，请联系作者

一、引子

1 什么是数据？

x=10，10是我们要存储的数据

2 为何数据要分不同的类型

数据是用来表示状态的，不同的状态就应该用不同的类型的数据去表示

3 数据类型

数字、字符串、列表、元组、字典、集合

二、基础数据类型

2.1 数字 int

数字主要是用于计算用的，使用方法并不是很多，就记住一种就可以：
int() 可以把其他类型转化为数字类型，并自动除去空格，但是前提是转化的数字

# bit_length() 当十进制用二进制表示时，最少使用的位数
v = 11
data = v.bit_length()
print(data)

2.2 布尔值bool

布尔值就两种：True，False

真   1   True
假   0   False

int:0   list:[]   tuple:{}   str:'' 转化为布尔值是False，其他的都是True

2.3 字符串str

2.3.1 字符串的索引与切片。

索引即下标，就是字符串组成的元素从第一个开始，初始索引为0，以此类推。

a = 'ABCDEFGHIJK'
print(a[0])   # A
print(a[3])   # D
print(a[-1])  # K

切片就是通过索引（索引：索引：步长）截取字符串的一段，形成新的字符串（原则就是顾头不顾腚）。

a = 'ABCDEFGHIJK'
print(a[0:3])
print(a[2:5])
print(a[0:])      # 默认到最后  ABCDEFGHIJK
print(a[0:-1])    # -1 是列表中最后一个元素的索引，但是要满足顾头不顾腚的原则，所以取不到K元素 
print(a[0:5:2])   # 加步长  ACE
print(a[5:0:-2])  # 反向加步长  FDB

2.3.2、字符串常用方法。

# 大小写转化 captalize,swapcase,title
name = 'flp'
print(name.capitalize())  # 首字母大写
print(name.swapcase())    # 大小写翻转
msg='i love china'
print(msg.title())        # 每个单词的首字母大写


# 内容居中 center
a1 = 'abcdefgabcd'
ret2 = a1.center(20,"*")  # 内容居中（总长度，空白处填充）
print(ret2)


# 统计字符串出现元素个数 count
ret3 = a1.count("a",0,4)  # 字符串中的元素出现的个数，可切片(元素，开始位置，结束位置)
print(ret3)


# \t补全
a2 = "hqw\t"
ret4 = a2.expandtabs()  # 默认将一个tab键变成8个空格，如果tab前面的字符长度不足8个，则补全8个，如果tab键前面的字符长度超过8个不足16个则补全16个，以此类推每次补全8个
print(ret4)


# 判断字符串开头结尾 可切片startswith，endswith
a4 = "dkfjdkfasf54"
ret4 = a4.startswith('jdk',3,6)  # 判断是否以...开头，顾头不顾腚，返回的是布尔值
print(ret4)
ret5 = a4.endswith("kfj",1,4)    # 判断是否以...结尾，顾头不顾腚，返回的是布尔值
print(ret5)


# 判断字符串中的元素是否存在 可切片find index
ret6 = a4.find("fjdk",1,6)      # 返回的找到的元素的索引，如果找不到返回-1
print(ret6)
ret61 = a4.index("fjdk",4,6)    # 返回的找到的元素的索引，找不到报错
print(ret61)
# 注：在用find判断字符不存在时，用下列的方式，因为不存在返回值是-1。
# if a4.find("fjdk",1,6) == -1


# split 分割，最终形成一个列表此列表不含有这个分割的元素。
a5 = 'title,Tilte,atre,'
ret9 = a5.split('t')
print(ret9)     # 结果['', 'i', 'le,Til', 'e,a', 're,']
ret91 = a5.rsplit('t',1)
print(ret91)    # 结果['title,Tilte,a', 're,']
ret92 = a5.rsplit('t',2)
print(ret92)    # 结果['title,Til', 'e,a', 're,']


# format的三种玩法 格式化输出
res='{} {} {}'.format('egon',18,'male')      # 结果 egon,18,male
res='{1} {0} {1}'.format('egon',18,'male')   # 结果 18,egon,18
res='{name} {age} {sex}'.format(sex='male',name='egon',age=18)


# strip切除字符串开头或结尾的字符
name='*egon**'
print(name.strip('*'))   # 切除字符串开头和结尾包含的*
print(name.lstrip('*'))  # 切除字符串开头包含的*
print(name.rstrip('*'))  # 切除字符串结尾包含的*


# replace字符串替换
name='flp China name is flp'
print(name.replace('flp','shuai',1))  #（要替换的字符串，替换成的字符串，替换的个数）


# is系列
name='flp123'
print(name.isalnum())  # 字符串由字母或数字组成，返回布尔值
print(name.isalpha())  # 字符串只由字母组成，返回布尔值
print(name.isdigit())  # 字符串只由数字组成，返回布尔值


# 判断字符串是否为空
s=' '
if s.strip()=='':
    print('s is null')
# 或者
if not s.strip():
    print('s is null')

2.4 元祖tuple

元组被称为只读列表，即数据可以被查询，但不能被修改，所以，字符串的切片操作同样适用于元组。例：（1，2，3）（"a","b","c"）

2.5 列表list

列表是python中的基础数据类型之一，其他语言中也有类似于列表的数据类型，比如js中叫数组，他是以[]括起来，每个元素以逗号隔开，而且他里面可以存放各种数据类型比如：

li = [123,Ture,(1,2,3,’abc’),[1,2,3,’小明’,],{‘name’:’abc’}]

列表相比于字符串，不仅可以储存不同的数据类型，而且可以储存大量数据，32位python的限制是 536870912 个元素,64位python的限制是 1152921504606846975 个元素。而且列表是有序的，有索引值，可切片，方便取值。

2.5.1、增

li = [1,'a','b',2,3,'a']
li.insert(0,55)          # 按照索引去增加
print(li)                # [55, 1, 'a', 'b', 2, 3, 'a']

li.append('aaa')         # 增加到最后
li.append([1,2,3])
print(li)                # [55, 1, 'a', 'b', 2, 3, 'a', 'aaa', [1, 2, 3]]

li.extend(['q,a,w'])     # 迭代的去增
li.extend(['q,a,w','aaa'])
li.extend('a')
li.extend('abc')
li.extend('a,b,c')
print(li)
# [55, 1, 'a', 'b', 2, 3, 'a', 'aaa', [1, 2, 3], 'q,a,w', 'q,a,w', 'aaa', 'a', 'a', 'b', 'c', 'a', ',', 'b', ',', 'c']

2.5.2、删

li = [1,'a','b',2,3,'a']
l1 = li.pop(1)         # 按照位置去删除，有返回值，返回被删除的元素
print(l1,li)           # a [1, 'b', 2, 3, 'a']

del li[1:3]            # 按照位置去删除，也可切片删除没有返回值。
print(li)              # [1, 3, 'a']

li.remove('a')         # 按照元素去删除
print(li)              # [1, 3]

li.clear()             # 清空列表

2.5.3、改

li = [1,'a','b',2,3,'a']
li[1] = 'dfasdfas'
print(li)             # [1, 'dfasdfas', 'b', 2, 3, 'a']

li[1:3] = ['a','b']
print(li)             # [1, 'a', 'b', 2, 3, 'a']

2.5.4、查

切片去查，或者循环去查。

2.5.5、其他操作

# count 统计某个元素在列表中出现的次数
a = ["q","w","q","r","t","y"] print(a.count("q"))
# index 用于从列表中找出某个值第一个匹配项的索引位置
a = ["q","w","r","t","y"] print(a.index("r")) 

# sort 用于在原位置对列表进行排序，没有返回值
a = [2,1,3,4,5] 
a.sort()        # 他没有返回值，所以只能打印排序后的a 
print(a)

# reverse 将列表中的元素反向存放，也没有返回值
a.reverse()    # 他也没有返回值，所以只能打印排序后的a 
print(a)

2.6字典dict

字典是python中唯一的映射类型，采用键值对（key-value）的形式存储数据。python对key进行哈希函数运算，根据计算的结果决定value的存储地址，所以字典是无序存储的，且key必须是可哈希的。可哈希表示key必须是不可变类型，如：数字、字符串、元组。

字典(dictionary)是除列表外，python之中最灵活的内置数据结构类型。列表是有序的对象结合，字典是无序的对象集合。两者之间的区别在于：字典当中的元素是通过键来存取的，而不是通过偏移存取。

2.6.1、增

dic = {}
dic['li'] = ["a","b","c"]
print(dic)        # {'li': ['a', 'b', 'c']}
# setdefault 在字典中添加键值对，如果键对应的值是none,则添加；如果值不为空，则不会更改覆盖。
dic.setdefault('k','v')
print(dic)        # {'age': 18, 'name': 'jin', 'sex': 'male', 'k': 'v'}
dic.setdefault('k','v1')  
print(dic)        # {'age': 18, 'name': 'jin', 'sex': 'male', 'k': 'v'}

2.6.2、删

dic_pop = dic.pop("a",'无key默认返回值') # pop根据key删除键值对，并返回对应的值，如果没有key则返回默认返回值
print(dic_pop)

del dic["name"]                         # 没有返回值。
print(dic)

dic_pop1 = dic.popitem()                # 随机删除字典中的某个键值对，将删除的键值对以元祖的形式返回
print(dic_pop1)  

dic_clear = dic.clear()                 # 清空字典
print(dic,dic_clear)                    # {} None

注：在循环字典本身的时候，不能删除字典的键值对

2.6.3、改

dic = {"name":"jin","age":18,"sex":"male"}
dic2 = {"name":"alex","weight":75}
dic2.update(dic)      # 将dic所有的键值对覆盖添加（相同的覆盖，没有的添加）到dic2中
print(dic2)           # {'name': 'jin', 'weight': 75, 'age': 18, 'sex': 'male'}

2.6.4、查

value1 = dic["name"]  # 没有会报错
print(value1)

value2 = dic.get("djffdsafg","默认返回值")  # 没有可以返回设定的返回值
print(value2)

2.6.5、其他操作

item = dic.items()
print(item,type(item))  
# dict_items([('age', '18'), ('sex', 'male')) <class 'dict_items'>这个类型就是dict_items类型，可迭代的

keys = dic.keys()
print(keys,type(keys))      # dic的所有k

values = dic.values()
print(values,type(values))  # dic的所有值

# 字典的循环。
dic = {"age":18,"sex":"male"}
for key in dic:
    print(key)
for item in dic.items():
    print(item)
for key,value in dic.items():
    print(key,value)

# 判断值是否在字典中
if 'age' in dic.keys: 
if 'age' in dic:


# fromkeys(seq[, value]) 函数用于创建一个新字典，以序列 seq 中元素做字典的键，value 为字典所有键对应的初始值。
dict.fromkeys(seq[, value])
    seq -- 字典键值列表。
    value -- 可选参数, 设置键序列（seq）的值。

seq = ('Google', 'Runoob', 'Taobao')
dict = dict.fromkeys(seq)
print "新字典为 : %s" %  str(dict)
# 新字典为 : {'Google': None, 'Taobao': None, 'Runoob': None}

dict = dict.fromkeys(seq, 10)
print "新字典为 : %s" %  str(dict)
# 新字典为 : {'Google': 10, 'Taobao': 10, 'Runoob': 10}

2.7 集合set

集合：可变的数据类型，他里面的元素必须是不可变(可哈希)的数据类型，无序，不重复

去重：把一个列表变成集合会自动去重

关系测试是，测试两组数据之前的交集，差集，并集等关系

创建

set1 = set(1,2,abc)

增

set1.add('dong')
set1.update([1,2,3])

删

set1.remove('a') # 删除一个元素
set1.pop('b')    # 随机删除一个，有返回值，返回值为删除的元素
set1.clear()     # 清除set
del set1         # 删除set1

查

for i in set1 :
    print(i)

关系测试

set1 = {1,2,3,4,'a'}
set2 = {'a','b','c','d',1}
print(set1 & set2)    
print(set1.intersection(set2)) # 交集{1, 'a'}

print(set1 | set2)    
print(set2.union(set1))        # 并集{1, 2, 3, 4, 'd', 'b', 'c', 'a'}

print(set1 - set2)    
print(set1.symmetric_difference(set2)) # 差集，set1独有的{2, 3, 4}
 
print(set1 ^ set2)    
print(set1.difference(set2))   # 反交集{2, 3, 4, 'c', 'd', 'b'}

print(set1 > set2)    
print(set1.issubset(set2))     # 这两个相同，都是说明set1是set2子集。

print(set2 < set2)
print(set2.issuperset(set1))   # 这两个相同，都是说明set2是set1超集。

三丶基础数据类型的总结

按存储空间的占用分（从低到高）

数字

字符串

集合：无序，即无序存索引相关信息

元组：有序，需要存索引相关信息，不可变

列表：有序，需要存索引相关信息，可变，需要处理数据的增删改

字典：无序，需要存key与value映射的相关信息，可变，需要处理数据的增删改

按存值个数区分

标量／原子类型	数字，字符串
容器类型	列表，元组，字典

按可变不可变区分

可变	列表，字典
不可变	数字，字符串，元组，布尔值

按访问顺序区分

直接访问	数字
顺序访问（序列类型）	字符串，列表，元组
key值访问（映射类型）	字典

四丶其他（for，enumerate，range）

for循环：用户按照顺序循环可迭代对象的内容。

msg = 'Lepeng最帅'
for item in msg:
    print(item)

li = ['赵','钱','孙','李']
for i in li:
    print(i)

dic = {'name':'Lepeng','age':18,'sex':'man'}
for k,v in dic.items():
    print(k,v)

enumerate：枚举，对于一个可迭代的（iterable）/可遍历的对象（如列表、字符串），enumerate将其组成一个索引序列，利用它可以同时获得索引和值。

li = ['赵','钱','孙','李']
for i in enumerate(li):
    print(i)
for index, name in enumerate(li, 100):  # 起始位置默认是0，可更改
    print(index, name)
# 100 赵
# 101 钱
# 102 孙
# 103 李

range：指定范围，生成指定数字。

for i in range(1,10):
    print(i)

for i in range(1,10,2):  # 步长
    print(i)

join：用于将序列中的元素以指定的字符连接生成一个新的字符串。

语法： 'sep'.join(seq)

参数说明

sep：分隔符，可以为空

seq：要连接的元素序列、字符串、元组、字典

上面的语法即：以sep作为分隔符，将seq所有的元素合并成一个新的字符串,然后返回

示例
s1 = "-"
s2 = ""
seq = ("r", "u", "n", "o", "o", "b") # 字符串序列
print (s1.join( seq ))    # r-u-n-o-o-b
print (s2.join( seq ))    # runoob

五，判断是否是字符串，字典等（isinstance）

在实际写程序中，经常要对变量类型进行判断，除了用type(变量)这种方法外，还可以用isinstance方法判断：

#!/usr/bin/env python
a = 1
b = [1,2,3,4]
c = (1,2,3,4)
d = {'a':1,'b':2,'c':3}
e = "abc"
if isinstance(a,int):
    print "a is int"
else:
    print "a is not int"
if isinstance(b,list):
    print "b is list"
else:
    print "b is not list"
if isinstance(c,tuple):
    print "c is tuple"
else:
    print "c is not tuple"
if isinstance(d,dict):
    print "d is dict"
else:
    print "d is not dict"
if isinstance(e,str):
    print "d is str"
else:
    print "d is not str"

六丶相互转化

# 1、字典
dict1 = {'name': 'Zara', 'age': 7, 'class': 'First'}
# 字典转为字符串，返回：<type 'str'> {'age': 7, 'name': 'Zara', 'class': 'First'}
print(type(str(dict1)), str(dict1))
# 字典可以转为元组，返回：('age', 'name', 'class')
print(tuple(dict1))
# 字典可以转为元组，返回：(7, 'Zara', 'First')
print(tuple(dict1.values()))
# 字典转为列表，返回：['age', 'name', 'class']
print(list(dict1))
# 字典转为列表，返回：['Zara', 7, 'First']
print(list(dict1.values()))

# 2、元组
tup=(1, 2, 3, 4, 5)
# 元组转为字符串，返回：(1, 2, 3, 4, 5)
print(tup.__str__())
# 元组转为列表，返回：[1, 2, 3, 4, 5]
print(list(tup))
# 元组不可以转为字典

# 3、列表
nums=[1, 3, 5, 7, 8, 13, 20];
# 列表转为字符串，返回：[1, 3, 5, 7, 8, 13, 20]
print(str(nums))
# 列表转为元组，返回：(1, 3, 5, 7, 8, 13, 20)
print(tuple(nums))
# 列表不可以转为字典

# 4.1、字符串之eval函数，此函数有风险，需慎用，此函数的参数可以是系统命令，所以会存在风险
# 字符串转为元组，前提是字符串像元组,返回：(1, 2, 3)
print(eval("(1,2,3)"))
# 字符串转为列表，前提是字符串像列表,返回：[1, 2, 3]
print(eval("[1,2,3]"))
# 字符串转为字典，前提是字符串像字典,返回：{'name': 'ljq', 'age': 24}
print(eval("{'name':'ljq', 'age':24}"))

# 4.2、字符串转换其他方式
# 字符串转为列表，结果['', 'i', 'le,Til', 'e,a', 're,']
a5 = 'title,Tilte,atre,'
print(a5.split('t'))

# 字符串转为字典
s = "Name1=Value1;Name2=Value2;Name3=Value3"
d = dict(item.split("=") for item in s.split(";"))
print(d)
# 结果为dict = { "Name1": "Value1", "Name2": "Value2", "Name3": "Value3" }，
# 注意s结尾不能是;如果是，用s.rstrip(';')

七，注意事项

如果元组只有一个元素，如果不加逗号，此元素是什么类型，则就是什么类型，如果元组只用（）表示，也不存在此情况；list，字典不存在此情况

tu1 = ()             # <class ''tuple'>
tu2 = (1)            # <class 'int'>
tu3 = (1,)           # <class 'tuple'>

list1 = ['a']        # <class 'list'>
list2 = []           # <class 'list'>

八丶深浅copy

1，先看赋值运算

l1 = [1,2,3,['AB','ab']]
l2 = l1

l1[0] = 111
print(l1)    # [111, 2, 3, ['AB', 'ab']]
print(l2)    # [111, 2, 3, ['AB, 'ab']]

l1[3][0] = 'EEE'
print(l1)    # [111, 2, 3, ['EEE', 'ab']]
print(l2)    # [111, 2, 3, ['EEE', 'ab']]

对于赋值运算来说，l1与l2指向的是同一个内存地址，所以他们是完全一样的。

2，浅拷贝copy

# 同一代码块下：
l1 = [1, 'abc', True, (1,2,3), [22, 33]]
l2 = l1.copy()
print(id(l1), id(l2))          # 2713214468360 2713214524680 不同
print(id(l1[-2]), id(l2[-2]))  # 2547618888008 2547618888008 相同
print(id(l1[-1]),id(l2[-1]))   # 2547620322952 2547620322952 相同

# 不同代码块下：
l1 = [1, 'abc', True, (1, 2, 3), [22, 33]]
l2 = l1.copy()
print(id(l1), id(l2))         # 1477183162120 1477183162696 不同
print(id(l1[-2]), id(l2[-2])) # 1477181814032 1477181814032 相同
print(id(l1[-1]), id(l2[-1])) # 1477183162504 1477183162504 相同

对于浅copy来说，只是在内存中重新创建了开辟了一个空间存放一个新列表，但是新列表中的元素与原列表中的元素是公用的。

3，深拷贝deepcopy。

# 同一代码块下
import copy
l1 = [1, 'abc', True, (1,2,3), [22, 33]]
l2 = copy.deepcopy(l1)
print(id(l1), id(l2))         # 2788324482440 2788324483016 不同
print(id(l1[0]),id(l2[0]))    # 1470562768 1470562768 相同
print(id(l1[-1]),id(l2[-1]))  # 2788324482632 2788324482696 不同
print(id(l1[-2]),id(l2[-2]))  # 2788323047752 2788323047752 相同

# 不同代码块下
import copy
l1 = [1, 'abc', True, (1, 2, 3), [22, 33]]
l2 = copy.deepcopy(l1)
print(id(l1), id(l2))         # 1477183162824 1477183162632 不同
print(id(0), id(0))           # 1470562736 1470562736 相同
print(id(-2), id(-2))         # 1470562672 1470562672 相同
print(id(l1[-1]), id(l2[-1])) # 1477183162120 1477183162312 不同

对于深copy来说，列表是在内存中重新创建的，列表中可变的数据类型是重新创建的，列表中的不可变的数据类型是公用的。

奔跑的大西吉

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
Python 之数据类型

数字字符串集合：无序，即无序存索引相关信息元组：有序，需要存索引相关信息，不可变列表：有序，需要存索引相关信息，可变，需要处理数据的增删改字典：无序，需要存key与value映射的相关信息，可变，需要处理数据的增删改。
复制链接

扫一扫