Python入门知识点 7--散列类型与字符编码

1、初识散列类型(无序序列)

数据类型分为3种:
    前面已经学过了两种类型
    1.数值类型:int/float/bool 只能存储单个数据
    
    2.序列类型:str/list/tuple,有序的存储多个数据--有序类型,有下标,可以进行索引切片步长操作
        
    3.散列类型:字典/集合
        (1)可以存放多个数据
        (2)内部是无序的(没有下标)
        (3)内部数据不重复

2、认识集合

集合set:表示形式为:用大括号{}包裹起来的数据,里面的数据用逗号隔开

集合的特性:主要是用来进行去重和逻辑判断
    1.唯一性
    2.无序型
    
语法:
    集合名={数据1,数据2,数据3,....}

room={'张三','李四','王五','麻子','小赵'}
print(room)
print(type(room)) #<class 'set'>

num={1,2,3,4,5,6,7,8,9,1,1,2,2,4,4,3}
print(num) #正常输出一个集合,里面重复元素会自动去除,代表集合的唯一性
# print(num[1]) 报错,因为集合是无序类型,没有下标

集合可以进行简单的逻辑运算--交并差集
    集合1 & 集合2-->获取交集--两个集合都有的数据
    集合1 | 集合2-->获取并集--两个集合里所有的数据(去重)
    集合1 - 集合2-->获取差集--两个集合之间,自己(在前的那一个)独有的数据
    
例子:现在我有两只碗
    碗1={花菜,鸡肉,凤爪}
    碗2={鸡肉,豆腐,梅菜}
    
交集-->两只碗里面都有的菜-->鸡肉
并集-->两只碗里所有的菜-->花菜,鸡肉,凤爪,豆腐,梅菜
差集-->碗1-碗2 -->碗1独有的菜  花菜,凤爪
      碗2-碗1 -->碗2独有的菜  豆腐,梅菜

num1={1,2,3}
num2={3,4,5}
print(num1&num2) #{3}
print(num1|num2) #{1, 2, 3, 4, 5}
print(num1-num2) #{1, 2}
print(num2-num1) #{4, 5}

集合里可以放很多数据(不能放列表,也不能嵌套集合,字典)
#talk={'你好',66,9.9,True,[12,3],{1,2}}
#print(talk) #报错 不能放列表,集合

#遍历集合
for i in talk:
    print(i)

集合的本质:
    1.存储非重复数据-->去重
    2.进行逻辑判断,进行交并差集运算

3、集合的方法

room= {'麻子','小王','老莫','小赵'} 

add: 添加一个数据到集合里
	集合.add(数据) #随机 因为是无序 所以随机增加
	room.add('好好学习')
	print(room)

update:  把一个序列类型打散后添加到集合里
	集合.update(序列数据)
	room.update('天天向上')
	print(room)

pop: 删除一个数据(随机删除)
	集合.pop()
	room.pop()
	print(room)

remove: 删除指定的数据
	集合.remove(数据)
	room.remove('小赵')
	print(room)
    
clear:清除所有数据
    集合.clear()
	room.clear()
	print(room) #set()空集合

4、认识字典

字典dict:表示形式为用{}大括号包裹起来的数据,存储数据是以键值对的方式存储

,数据之间要用逗号隔开,主要存储一些带有'说明'性质的数据
    键值对   左边是键 中间冒号 右边是键值
    key:value
        
声明语法:
    字典名={键:值,键:值}

    info={
        '姓名':'小赵',
        '余额':8.8,
        '年龄':18
    }

字典的输出

print(info)
print(type(info)) #<class 'dict'>
    
print(字典名[键名]) #输出指定键的值
print(info['姓名']) #输出指定键的值‘小赵’

字典的特性:
    1.字典是通过键值对的方式来获取数据,而不是通过下标索引获取

print(info['姓名']) #输出指定键的值‘小赵’


    2.字典里的键是不可变的,只能使用数字,字符串或者元组,不能使用列表(一般键是用字符串或者整型来表示)

day=(2,3)
food={
    1:'肉',
    '水果':'葡萄',
    day:'打折日'
}
print(food)

# info2={
#     [1,2]:'小赵'
# }
# print(info2) #报错 键不能放列表

    3.字典里的键值是可以修改的,还可以嵌套(字典里面可以放个字典)

info3={
 '姓名':'小赵',
 '余额':[8.8,1,9],
 '地址':{1:'工作地址',2:'家乡地址'}
}
print(info3)

4.字典里面键名是唯一的

info4={
  '姓名':'小赵',
  '余额':8.8,
  '年龄':18,
  '年龄':19,
  '年龄':20
}
print(info4) #只会保留最后一个键值对

如果数据有明显的对照关系,就可以用字典来保存,看起来会更加的清晰明了

#字典遍历

for i in info5:
    print(i) #i拿到的是键
    print(info5[i]) #字典名[键名]就可以拿到对应的键值

5、字典方法

info={
    '姓名':'小赵',
    '余额':8.8,
    '年龄':18
	}

setdefault: 给字典添加一个键值对,如果已经有这个键了,就不会新增
	1.新增一个键,没有写值,值默认为空
	字典.setdefault(键名)
	info.setdefault('身高') #没有值,值默认为空
	print(info)

	2.新增一个键值对
	字典.setdefault(键名,值)
	info.setdefault('家乡','山东')
	print(info)

pop: 通过键名删除指定的数据,键值都删除
	字典.pop(键名)
	info.pop('年龄')
	print(info)

popitem:  删除一个键值对,从最后一个数据开始删
	字典.popitem()
	info.popitem()
	print(info)

clear: 清除整个字典
	字典.clear()
	info.clear()
	print(info) #{} 空字典

update: 以键值对的方式修改数据.如果没有就新增
	1.有这个键的话 就修改键的值
	字典.update({键:值})
	info.update({'姓名':'小赵同学'})
	print(info)

	2.如果没有这个键值对,就转为新增
	字典.update({键:值})
	info.update({'爱好':'运动'})
	print(info)
    
    3.增加多个键值对
	字典.update({键:值,键:值})
	info.update({'职业':'学生','性别':'女'})
	print(info)	
    
字典[键名]=值 #修改指定键的值 键是存在的情况下会将原来的值进行修改操作,否则添加为新的键值对
info['性别']='男' #找到info里面的性别,把键值改为男
info['生肖']='龙' #也算是一个新增方法,创建新的键值对
print(info)

字典跟集合一样是无序序列,所以是无法通过下标进行获取数据,但是字典有查询数据的方法,查询的方法依旧需要print包裹方法输出

get: 通过键名,获取值. 如果没有这个键,输出None
	字典.get(键名)
  	print(info.get('余额'))
    print(info.get('籍贯'))

keys: 获取所有的键
	字典.keys()
 	print(info.keys())

values: 获取所有的值
	字典.values()
	print(info.values())

items: 获取所有的键值对
	字典.items()
	print(info.items())

6、声明空变量

字符串=''   #声明一个空字符串
元组名=()  #声明一个空元组
列表名=[]  #声明一个空列表
集合名=set()  #声明一个空集合
字典名={}  #声明一个空字典

7、字符编码

计算机语言最底层是由0和1组成,计算机是怎么把一堆的0和1变成我们看到字呢-->字符编码

字符编码 -- 翻译工具 --把计算机的机器码翻译成人类能看的懂的字

第一套字符编码叫ASCII码,里面收纳了一些常用符号,数字,字母-->没有中文或者其他的语言
ASCII码表用法有点类似于字典-->每个字在表里都有一个对应的序号,可以通过序号找到字,也可以通过字找到序号

但是随着科技进步,很多国家都拥有了自己的计算机技术能力,这时候ASCII码就不能满足需求了-->我要用中文/或者其他的语言

后面很多国家、地区都自己研发了一套字符编码
    中国研发出GBK编码-->有两万多个汉字
    同时间中国台湾-->BIG5,大五码,繁体字
    
每个国家的语言不同  所以只会显示出自己国家的文字
用别的国家软件就容易出现问题
#就比如如果用GBK编码写的内容,用BIG5打开就是乱码,不通用

针对这个问题,有个国际组织,专门收集了全世界大部分国家的语言文字,汇总做了一个大的字典并推行使用,以后统一用大字典就可以尽量避免乱码-->UTF-8(万国码)
    
核心点:
    1.目前世界上最主流的编码是<UTF-8> #大部分默认用UTF-8
    2.一个程序是用什么编码写的,你就要用对应的编码去读取,否则容易出问题

在程序中每个字都是有对应的序号

ord(字符)-->通过字符,找到序号
chr(序号)-->通过序号,找到字符
print(ord('A'))
print(ord('B'))
print('A'>'B')
print(chr(98))
print(chr(100))

有什么问题欢迎随时评论或者私信哦~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

@网工小赵

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值