Python基础核心知识点(建议收藏再用)

目录

  • 一、python入门day1-day24
    • day01-03 编程语言
    • day04 变量
    • day05 垃圾回收机制(GC机制)
      • 1 引用计数
      • 2 标记清除
      • 3 分代回收
    • day05 程序交互与基本运算符
    • day06 可变不可变类型
    • day07 流程控制
      • 1 赋值 =
      • 2 浅拷贝 copy
      • 3 深拷贝 deepcopy
    • day08-10 基本数据类型
      • 1 字符串
      • 2 列表
      • 3 元组
      • 4 字典
      • 5 集合
      • 6 基本数据类型总结
    • day10 字符编码
      • 1 ascii表
      • 2 GBK(中国),Shift_JIS(日本)等等
      • 3 unicode
      • 4 utf-8
    • day11-12 文件操作
      • 1 读相关操作:
      • 2 写相关操作:
      • 3 文件高级操作:
    • day13-14 函数基础
    • day15 名称空间和作用域
      • 1 命名关键字参数:
      • 2 名称空间的存活时间
    • day16 闭包函数
    • day17 装饰器
      • 修正装饰器:
    • day18 迭代器+生成器
      • 1 迭代器
      • 2 生成器
    • day19 生成式
      • 1 三元表达式
      • 2 生成式
        • 2.1 列表生成式
        • 2.2 字典生成式
        • 2.3 集合生成式
        • 2.4 生成器表达式
    • day20 匿名函数
      • 1 lambda使用
      • 2 lambda与内置函数的应用
      • 3 map
      • 4 reduce
      • 5 filter
    • day21模块(略)
    • day22-24 常用模块
      • 1 time模块
      • 2 datetime模块
      • 3 random模块
      • 4 os
      • 5 sys模块
      • 6 shutil
      • 7 json&pickle
      • 8 hashlib
      • 9 logging(略)
      • 10 re(略)
        在这里插入图片描述

一、python入门day1-day24

day01-03 编程语言

python是一种强类型的解释型语言

day04 变量

变量名不能以数字开头

小整数池的范围[-5,256],pycharm里这个范围非常大

这是为了优化内存的合理安排

指向相同数字的变量名id相同

day05 垃圾回收机制(GC机制)

为了解决没有被引用的数据(垃圾)大量占用内存导致程序崩溃

1 引用计数

a = 10 表示10被a引用了1次,a = 20 表示a和10断开链接,a与20相连接20的引用计数为1,10的引用计数为0(垃圾)

存在的问题:循环引用

l1 = ['xxx']
l2 = ['yyy']
l1.append(l2)
l2.append(l1)
# l1与l2循环引用了
# 此时['xxx']被l1引用了1次,被['yyy']引用了一次,引用计数为2
# 此时['yyy']被l1引用了1次,被['xxx']引用了一次,引用计数为2

del l1
del l2
# 按照常规['xxx']['yyy']此时的引用计数为0要被清除,但是由于循环引用的问题,他们俩彼此互相引用导致引用计数失效

2 标记清除

标记清除是当内存即将被程序占满的时候,把程序停下来,进行标记清除

标记清除分为两步:

  • 标记
    • 遍历所有的GC Roots对象(栈区内所有的名字或者线程),将所有可以被直接或者间接访问到的堆区对象标记存活
  • 清除
    • 遍历堆区所有对象,没有被标记的就清除。

刚刚循环引用的地方,堆区的两个列表虽然互相引用,但是他们没有被栈区的任何对象直接或者间接访问,所以没有被标记,就被清除了。

3 分代回收

分代回收解决了引用计数的第二个问题,效率

工作原理:根据栈区中名字的使用频率为他们划分代,不同代的名字扫描频率不同。

day05 程序交互与基本运算符

/ 除,显示小数点

// 取整除,不显示小数点

解压赋值

num = [1,2,3,4]

# 全部解压
a,b,c,d = num
>>> a=1 b=2 c=3 d=4

# 部分解压
a,b,*_=num
>>> a=1 b=2

day06 可变不可变类型

可变类型:列表,字典(key:不可变类型,value:任意类型)

不可变类型:整形,浮点型,字符串,bool

day07 流程控制

深浅拷贝

1 赋值 =
l1 = [1,2,[3,4]]
l2 = l1
# 这时候l1 就是l2,id相同,对l1内部的可变类型不可变类型的修改都会影响l2

2 浅拷贝 copy
l1 = [1,2,[3,4]]
l2 = l1.copy()
# 把l1内部的第一层内存地址都copy给l2,l1和l2是两个id不同的列表
# 内部的可变类型其实是同一个,所以会同时修改
# 修改l1内部的不可变类型,l2不会跟着变
# 修改l1内部的可变类型,l2也会变

3 深拷贝 deepcopy
import copy 
l1 = [1,2,[3,4]]
l2 = copy.deepcopy(l1)
# 把l1内部的第一层内存地址都copy给l2,l1和l2是两个id不同的列表
# 不同的是,可变类型会在内存中复制一份,所以修改可变类型其实是不同的

这里注意的点就是可变类型的修改和不可变类型修改的区别

不可变类型直接会断开和原数据的链接,重新链接新数据

可变类型则是在原数据上进行修改

day08-10 基本数据类型

1 字符串
  • strip 去掉左右两边指定字符,默认空格(扩展:rsrip,lsrip)

  • split 从左到右以指定字符切割,默认空格,可以指定次数,默认全部(扩展rsplit,从右到左以指定字符切割)

  • lower 全大写,upper 全小写

  • srartswith 以什么为开头,endwith 以什么为结尾

  • ','join('hz') # 分隔字符串
    >>> h,z
    
    
  • replace 替换字符

  • isdigit 判断是否纯数字

  • find 查找是否有指定字符有则返回索引,无则返回-1

  • index查找是否有指定字符,有则返回索引,无则报错

  • count 统计赐重复出现的个数

2 列表
  • append 追加元素

  • extend 追加可迭代对象,会自动把可迭代对象循环添加,列表会循环添加key

  • insert 插入

  • del 常规删除,没有返回值

    • x = ['aa','bb']
      del x[0]
      
      
  • pop 索引删除,不写默认删除最后一个,返回值为删除的元素

  • remove 指名道姓删除,返回值为None

  • count 统计指定元素出现次数

  • index 查找指定元素索引

  • clear 清空索引

  • reverse 反转列表

  • sort 排序

3 元组

看做是不可修改的列表

注意:元组内必须加逗号,如果一个或者没有元素的时候元组不加逗号会看成数学的括号

  • index 查找指定元素索引
  • count 统计指定元素出现次数
4 字典
  • get 取值,和索引取的区别是get取不到返回None,索引取不到报错
  • pop 删除,返回值为key
  • popitem 随机删除,删除的键值对以(key,value)的形式返回
  • update 更新,存在则修改,不存在则新增
  • setdefault 新增,key不存在则新增,key存在则返回原来的value值

注意

python3.5之后的字典是有序字典,因为更新之后优化了内部字典的存值方式,把原来的二维数组分成了现在一个一维数组+一个二维数组,但是原本创建一个字典就会创建8个位置,现在是创建一个字典生成一个位置

5 集合

可以把可变类型转化成集合在转回来可以去重,但是这种去重是无序的

  • 关系运算
    • & 交集 共有的
    • | 合集 融合去重
    • — 差集 某个集合单有的
    • ^ 对称差集 两个集合单独有的的合集
    • > 父子集 判断是否包含
  • discard 删除,存在则删除,不存在不变化
  • remove 删除,存在则删除,不存在则报错
  • update 更新,括号内放集合,会自动与元集合取合集
  • pop 删除指定元素,并返回,不写删除第一个
  • add 添加元素,只能添加不可变类型
6 基本数据类型总结

不包含集合

  • 按照存值个数区分
    • 只能存一个值:数字,字符串
    • 可以存多个值:字典,列表,元组
  • 按访问方式区分
    • 直接访问:数字
    • 顺序访问/索引访问:字符串,列表,元组
    • key访问:字典
  • 可变不可变区分
    • 可变:列表,字典,集合
    • 不可变:数字,元组,字符串

day10 字符编码

1 ascii表

只有英文字符与数字的一一对应关系

一个英文字符对应一个字节(bytes),一个字节等于8个bit,8个bit最多包含256个数字

2 GBK(中国),Shift_JIS(日本)等等

只有对应国家的文字和英文字符与数字的一一对应关系

2字节代表一个汉字

3 unicode

此时只能转换成对应字符编码的二进制,当出现unicode的时候开始统一

所有存在的文字都有与数字的一一对应关系,而传统的GBK等字符编码也能在unicode内找到对应关系

4 utf-8

当我们出现要输入多国语言的时候,unicode就会显得很臃肿

utf-8会显得更灵活

utf-8是针对unicode的可变长度字符编码,一个英文字符占一个bytes,一个汉字占3个,生僻字占更多

day11-12 文件操作

with 上下文资源管理,会自动帮我们在次级代码结束后关闭文件

显示模式:t文本模式(默认),b二进制

操作模式:r只读(默认),w只写,a只追加,+全都能读能写

1 读相关操作:
  • readline 一次读一行
  • readlines 把文件内容按照换行符为分隔返回列表
  • read 读取全部内容
2 写相关操作:
  • write 写入全部内容
  • writelines 是readlines的反操作

flsh 刷新

3 文件高级操作:

f.seek(n,模式) n代表移动的字节数

  • 0模式,参照物是文件的开头
  • 1模式,参照物是光标当前所在位置
  • 2模式,参照物是文件末尾,n为负数倒着移动
  • f.tell()得到当前光标所在位置

day13-14 函数基础

函数的返回值如果是多个元素,会自动放在一个元组内

day15 名称空间和作用域

1 命名关键字参数:

在传参时,*后面的都是命名关键字参数

特点是必须要以关键字传参方式传

2 名称空间的存活时间
  • 内置名称空间,解释器启动则存活,解释器关闭则销毁
  • 全局名称空间,文件执行则存活,文件关闭则销毁
  • 局部名称空间,调用函数时存活,调用完毕后销毁

day16 闭包函数

定义:是内嵌函数,引用了外部名称空间的名字

day17 装饰器

定义:给其他函数添加额外功能的工具

开放封闭原则:对扩展功能开放,对修改内部代码封闭(多处引用,修改可能会导致错乱)

无参装饰器只要两层函数,调用装饰器的时候不能加括号

有参装饰器需要在无参装饰器外面再加一层函数用于接收参数

修正装饰器:

functools模块下提供的一个装饰器,可以让我们在使用装饰器的时候让原函数看起来还和原来一样

from functools import wraps
def timer(func):
    @wraps(func)
    def wrapper(*args,**kwargs):
        start_time=time.time()
        res=func(*args,**kwargs)
        stop_time=time.time()
        print('run time is %s' %(stop_time-start_time))
        return res
    return wrapper

用print(help(func))来判断是否和原函数一致

day18 迭代器+生成器

1 迭代器

可迭代对象:内置有__iter__方法的对象

可迭代对象转换成迭代器对象:使用__iter__方法

迭代器对象:内置有__iter____next__方法的对象

可迭代对象:列表,字符串,字典,元组,集合,文件对象

迭代器对象:文件对象

迭代器的优点:

  • 为序列和非序列类型提供了一种统一的取值方式
  • 惰性计算,同一时间只存在一个数据,不会影响内存,其他数据类型存就是整体存

迭代器的缺点:

  • 除非取完整个迭代器,不然不知道迭代器长度
  • 无法控制取值,永远只能取下一个,如果要重新开始只能重新定义一个迭代器对象
2 生成器

生成器就是自定义迭代器,有yeild关键字的函数调用不会执行,会返回一个生成器,通过yeild关键字在指定位置挂起函数,通过__next__方法来继续执行函数直到下一次挂起或者return,yeild可以接受参数,也可以和return一样返回参数。

day19 生成式

1 三元表达式
条件成立时运行的代码 if 条件 else 条件不成立时运行的代码

2 生成式
2.1 列表生成式
l = ["a","b","c2","adsa","z"]
#需求:把列表内长度大于1的值添加到新列表new_l中
new_l = [i for i in l if len(i)>1]

2.2 字典生成式
d = {"a":1,"b":2,"c":3} # 这个d只要是个可迭代对象即可
#生成一个新的字典,key是d中的所有key,value为none
new_d = {key:None for key in d }

2.3 集合生成式
# 生成一个包含数字1-9的集合
s ={i for i in range(1,10)}

2.4 生成器表达式
g = (i for i in range(10) if i >3)

day20 匿名函数

1 lambda使用
lambda 参数1,参数2... : 返回值

2 lambda与内置函数的应用
dict1 = {"hz":10011,"lxt":1234,"hzxc":101}
res = max(dict1,key=lambda k:dict1[k])
print(res)

3 map
# 映射:把一个可迭代对象的每一个值拿出来作为函数的参数运行一次,把得到的值合并起来生成一个迭代器
l = [1,2,3,4]
res = map(lambda x:x**2,l)

4 reduce
#reduce函数可以接收三个参数,一个是函数,第二个是可迭代对象,第三个是初始值
from functools import  reduce
l = [1,2,3,4]
res = reduce(lambda x,y:x+y,l,1)
>>> 11
# 如果有初始值就会把初始值作为第一个参数传入,然后取出可迭代对象的第一个值作为第二个参数传入,得到的返回值作为下一次函数运行时的x,再把可迭代对象的第二个参数传入,一直调用函数直到可迭代对象循环结束

5 filter
#过滤列表l
l = [1,2,3,4]
res = filter(lambda x:x>3,l)
#filter会迭代列表l把得到的值传给匿名函数,如果得到结果为真,则过滤出该元素,得到一个迭代器
res >>> 4

day21模块(略)

day22-24 常用模块

1 time模块
  • time.time() 时间戳:从1970年到现在的秒数
  • time.strftime() 格式化时间
  • time.locatime() 结构化时间(共9个元素)

注意:结构化时间可以和时间戳互相转换,结构化时间也可以和格式化时间互相转换

2 datetime模块

datetime.datatime.now()获取当前时间,精确到毫秒,格式化时间

3 random模块
  • random.random() 取0到1之间的小数

  • random.randint(1,3) 取大于等于1,小于等于3的整数

  • random.randrange(1,3) 取大于等于1,小于3的整数

  • random.choice([1,2,3,4,5,6]) 列表或元组内部随机取一个元素

  • random.sample([1,2,3,4,5,6],n) 列表或元组内部随机取n个元素组合成列表

  • random.uniform(1,3) 取大于1小于3的小数

  • l1 = [1,2,3,4,5]
    random.shuffle(l1)
    # 把一个列表打乱
    
    
4 os
  • os.path.getsize(‘文件路径’) 计算该文件大小
  • os.path.dirname/basename(‘文件路径’) 获得该文件的父级目录/获得该文件的文件名
  • os.path.isfile(r’文件路径’) 是否是一个存在的文件,返回布尔值
  • os.path.isdir(r’文件路径’) 是否是一个存在的目录,返回布尔值
  • os.path.abspath(__file__) 获取当前文件路径
  • os.path.dirname(‘文件路径’) 获取当前文件路径的父级路径
  • os.mkdir(‘dirname’) 生成单级目录;相当于shell中mkdir dirname
  • os.path.exists(‘文件路径’) 如果path存在,返回True;如果path不存在,返回False
5 sys模块

sys.path.append(‘文件路径’) 给环境变量列表添加一个路径

通常用于解决跨文件导包的问题

6 shutil

用于拷贝文件

  • shutil.copy(文件1,文件2) 拷贝文件和权限
  • shutil.copy2(文件1,文件2) 拷贝文件和状态信息
7 json&pickle
  • json.loads(‘数据’) 序列化
  • json.dumps(‘数据’) 反序列化
  • pickle.loads(‘数据’) 序列化
  • pickle.dumps(‘数据’) 反序列化

两者的区别:json序列化成json数据可以供所有语言反序列化,pickle转化成pickle格式只能供python反序列化

8 hashlib

hash算法的模块

hash值的特点:

  • 只要传的值一样,用同样的hash算法得到的hash值必定一样
    • 可用于传输密码和验证文件的完整性
  • 不能由hash值反解成原来的内容
  • 只要hash算法不变,无论检验的内容由多大,hash值都是定长

基本操作:

import hashlib
pwd = 123456789
# 实例化md5对象,可以传任意参数,参数会跟着数据一起加密简称 加盐
m = hashlib.md5('盐')
m.update(pwd.encode('utf-8'))
pwd_md5 = m.hexdigest()

最后这里给大家免费分享一份Python学习资料,包含了视频、源码、课件,希望能够帮助到那些不满现状,想提示自己却又没用方向的朋友,也可以和我一起来交流呀!

编辑资料、学习路线图、源代码、软件安装包等!【点击这里】领取!
![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/1caf6cc3f64c43b2be373713c7b101e5.pn
在这里插入图片描述

  • 16
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值