10 基本数据类型及内置方法和字符编码

基本数据类型及内置方法和字符编码

1、集合

1.1 关系运算

friends1 = ["zero","kevin","jason","egon"]
friends2 = ["Jy","ricky","jason","egon"]

l=[]
for x in friends1:
    if x in friends2:
        l.append(x)
print(l)

1.2 定义:

在{}内用逗号分隔开多个元素,多个元素满足以下三个条件
1. 集合内元素必须为不可变类型
2. 集合内元素无序
3. 集合内元素没有重复

s={1,2} # s=set({1,2})

s={1,[1,2]} # 集合内元素必须为不可变类型
s={1,'a','z','b',4,7} # 集合内元素无序
s={1,1,1,1,1,1,'a','b'} # 集合内元素没有重复
print(s)

了解

s={} # 默认是空字典
print(type(s))
定义空集合
s=set()
print(s,type(s))

1.3 类型转换

set({1,2,3})
res=set('hellolllll')
print(res)

print(set([1,1,1,1,1,1]))
print(set([1,1,1,1,1,1,[11,222]]) # 报错

print(set({'k1':1,'k2':2}))

1.4 内置方法

关系运算符

friends1 = {"zero","kevin","jason","egon"}
friends2 = {"Jy","ricky","jason","egon"}

1.4.1 取交集

两者共同的好友

res=friends1 & friends2
print(res)
print(friends1.intersection(friends2))

1.4.2 取并集/合集

两者所有的好友

print(friends1 | friends2)
print(friends1.union(friends2))

1.4.3 取差集

取friends1独有的好友

print(friends1 - friends2)
print(friends1.difference(friends2))

取friends2独有的好友

print(friends2 - friends1)
print(friends2.difference(friends1))

1.4.4 对称差集

求两个用户独有的好友们(即去掉共有的好友)

print(friends1 ^ friends2)
print(friends1.symmetric_difference(friends2))

1.4.5 父子集

包含的关系

s1={1,2,3}
s2={1,2,4}
不存在包含关系,下面比较均为False
print(s1 > s2)
print(s1 < s2)
s1={1,2,3}
s2={1,2}
print(s1 > s2) # 当s1大于或等于s2时,才能说是s1是s2他爹
print(s1.issuperset(s2))
print(s2.issubset(s1)) # s2 < s2  =>True
s1={1,2,3}
s2={1,2,3}
print(s1 == s2) # s1与s2互为父子
print(s1.issuperset(s2))
print(s2.issuperset(s1))

1.5 去重

1.5.1 只能针对不可变类型去重

print(set([1,1,1,1,2]))

1.5.2 无法保证原来的顺序

l=[1,'a','b','z',1,1,1,2]
l=list(set(l))
print(l)

l=[
    {'name':'lili','age':18,'sex':'male'},
    {'name':'jack','age':73,'sex':'male'},
    {'name':'tom','age':20,'sex':'female'},
    {'name':'lili','age':18,'sex':'male'},
    {'name':'lili','age':18,'sex':'male'},
]
new_l=[]
for dic in l:
    if dic not in new_l:
        new_l.append(dic)
print(new_l)

1.6 其他操作

1.6.1 长度

s={'a','b','c'}
len(s)

1.6.2 成员运算

'c' in s

返回True

1.6.3 循环

for item in s:
     print(item)

1.7 其他内置方法

需要掌握的内置方法1:discard

s={1,2,3}
s.discard(4) # 删除元素不存在do nothing
print(s)
s.remove(4) # 删除元素不存在则报错

需要掌握的内置方法2:update

s={1,2,3}
s.update({1,3,5})
print(s)

需要掌握的内置方法3:pop

s={1,2,3}
res=s.pop()
print(res)

需要掌握的内置方法4:add

s={1,2,3}
s.add(4)
print(s)

1.8 其余方法全为了解

res=s.isdisjoint({3,4,5,6}) # 两个集合完全独立、没有共同部分,返回True
print(res)

s.difference_update({3,4,5}) # s=s.difference({3,4,5})
print(s)

2. 字符编码

2.1 Unicode

内存固定使用unicode,我们可以改变的是存入硬盘采用格式

  1. 英文+汉字-》unicode-》gbk
  2. 英文+日文-》unicode-》shift-jis
  3. 万国字符》-unicode-》utf-8

2.2 文本文件存取乱码问题

存乱了:解决方法是,编码格式应该设置成支持文件内字符串的格式。

取乱了:解决方法是,文件是以什么编码格式存如硬盘的,就应该以什么编码格式读入内存。

2.3 python解释器默认读文件的编码

python3默认:utf-8
python2默认:ASCII

指定文件头修改默认的编码:
在py文件的首行写:
# coding: utf-8

2.4 如何让程序不发生乱码

保证运行python程序前两个阶段(python解释器读文本文件的过程,与文本编辑读文本文件)不乱码的核心法则:

指定文件头:

# coding:文件当初存入硬盘时所采用的编码格式
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值