python3.8更新内容01

Python 3.8 有什么新变化
编者 Raymond Hettinger

本文解释了 Python 3.8 相比 3.7 的新增特性。 完整的详情可参阅 更新日志。

Python 3.8已于2019年10月14日发布。

摘要 - 发布重点
新的特性
赋值表达式
新增的语法 := 可在表达式内部为变量赋值。 它被昵称为“海象运算符”因为它很像是 海象的眼睛和长牙。

在这个示例中,赋值表达式可以避免调用 len() 两次:

if (n := len(a)) > 10:
print(f"List is too long ({n} elements, expected <= 10)")
类似的益处还可出现在正则表达式匹配中需要使用两次匹配对象的情况中,一次检测用于匹配是否发生,另一次用于提取子分组:

discount = 0.0
if (mo := re.search(r’(\d+)% discount’, advertisement)):
discount = float(mo.group(1)) / 100.0
此运算符也适用于配合 while 循环计算一个值来检测循环是否终止,而同一个值又在循环体中再次被使用的情况:

Loop over fixed length blocks

while (block := f.read(256)) != ‘’:
process(block)
另一个值得介绍的用例出现于列表推导式中,在筛选条件中计算一个值,而同一个值又在表达式中需要被使用:

[clean_name.title() for name in names
if (clean_name := normalize(‘NFC’, name)) in allowed_names]
请尽量将海象运算符的使用限制在清晰的场合中,以降低复杂性并提升可读性。

请参阅 PEP 572 了解详情。

(由 Morehouse 在 bpo-35224 中贡献。)

仅限位置形参
新增了一个函数形参语法 / 用来指明某些函数形参必须使用仅限位置而非关键字参数的形式。 这种标记语法与通过 help() 所显示的使用 Larry Hastings 的 Argument Clinic 工具标记的 C 函数相同。

在下面的例子中,形参 a 和 b 为仅限位置形参,c 或 d 可以是位置形参或关键字形参,而 e 或 f 要求为关键字形参:

def f(a, b, /, c, d, *, e, f):
print(a, b, c, d, e, f)
以下均为合法的调用:

f(10, 20, 30, d=40, e=50, f=60)
但是,以下均为不合法的调用:

f(10, b=20, c=30, d=40, e=50, f=60) # b cannot be a keyword argument
f(10, 20, 30, 40, 50, f=60) # e must be a keyword argument
这种标记形式的一个用例是它允许纯 Python 函数完整模拟现有的用 C 代码编写的函数的行为。 例如,内置的 pow() 函数不接受关键字参数:

def pow(x, y, z=None, /):
“Emulate the built in pow() function”
r = x ** y
return r if z is None else r%z
另一个用例是在不需要形参名称时排除关键字参数。 例如,内置的 len() 函数的签名为 len(obj, /)。 这可以排除如下这种笨拙的调用形式:

len(obj=‘hello’) # The “obj” keyword argument impairs readability
另一个益处是将形参标记为仅限位置形参将允许在未来修改形参名而不会破坏客户的代码。 例如,在 statistics 模块中,形参名 dist 在未来可能被修改。 这使得以下函数描述成为可能:

def quantiles(dist, /, *, n=4, method=‘exclusive’)

由于在 / 左侧的形参不会被公开为可用关键字,其他形参名仍可在 **kwargs 中使用:

def f(a, b, /, **kwargs):
… print(a, b, kwargs)

f(10, 20, a=1, b=2, c=3) # a and b are used in two ways
10 20 {‘a’: 1, ‘b’: 2, ‘c’: 3}
这极大地简化了需要接受任意关键字参数的函数和方法的实现。 例如,以下是一段摘自 collections 模块的代码:

class Counter(dict):

def __init__(self, iterable=None, /, **kwds):
    # Note "iterable" is a possible keyword argument

用于已编译字节码文件的并行文件系统缓存
新增的 PYTHONPYCACHEPREFIX 设置 (也可使用 -X pycache_prefix) 可将隐式的字节码缓存配置为使用单独的并行文件系统树,而不是默认的每个源代码目录下的 pycache 子目录。

缓存的位置会在 sys.pycache_prefix 中报告 (None 表示默认位置即 pycache 子目录)。

(由 Carl Meyer 在 bpo-33499 中贡献。)

调试构建使用与发布构建相同的 ABI
Python 现在不论是以发布模式还是调试模式进行构建都将使用相同的 ABI。 在 Unix 上,当 Python 以调试模式构建时,现在将可以加载以发布模式构建的 C 扩展和使用稳定版 ABI 构建的 C 扩展。

发布构建和调试构建现在都是 ABI 兼容的:定义 Py_DEBUG 宏不会再启用 Py_TRACE_REFS 宏,它引入了唯一的 ABI 不兼容性。 Py_TRACE_REFS 宏添加了 sys.getobjects() 函数和 PYTHONDUMPREFS 环境变量,它可以使用新的 ./configure --with-trace-refs 构建选项来设置。 (由 Victor Stinner 在 bpo-36465 中贡献。)

在 Unix 上,C 扩展不会再被链接到 libpython,但 Android 和 Cygwin 例外。 现在静态链接的 Python 将可以加载使用共享库 Python 构建的 C 扩展。 (由 Victor Stinner 在 bpo-21536 中贡献。)

在 Unix 上,当 Python 以调试模式构建时,导入操作现在也会查找在发布模式下编译的 C 扩展以及使用稳定版 ABI 编译的 C 扩展。 (由 Victor Stinner 在 bpo-36722 中贡献。)

要将 Python 嵌入到一个应用中,必须将新增的 --embed 选项传给 python3-config --libs --embed 以获得 -lpython3.8 (将应用链接到 libpython)。 要同时支持 3.8 和旧版本,请先尝试 python3-config --libs --embed 并在此命令失败时回退到 python3-config --libs (即不带 --embed)。

增加一个 pkg-config python-3.8-embed 模块用来将 Python 嵌入到一个应用中: pkg-config python-3.8-embed --libs 包含 -lpython3.8。 要同时支持 3.8 和旧版本,请先尝试 pkg-config python-X.Y-embed --libs 并在此命令失败时回退到 pkg-config python-X.Y --libs (即不带 --embed) (请将 X.Y 替换为 Python 版本号)。

另一方面,pkg-config python3.8 --libs 不再包含 -lpython3.8。 C 扩展不可被链接到 libpython (但 Android 和 Cygwin 例外,这两者的情况由脚本处理);此改变是故意被设为向下不兼容的。 (由 Victor Stinner 在 bpo-36721 中贡献。)

f-字符串支持 = 用于自动记录表达式和调试文档
增加 = 说明符用于 f-string。 形式为 f’{expr=}’ 的 f-字符串将扩展表示为表达式文本,加一个等于号,再加表达式的求值结果。 例如:

user = ‘eric_idle’
member_since = date(1975, 7, 31)
f’{user=} {member_since=}’
“user=‘eric_idle’ member_since=datetime.date(1975, 7, 31)”
通常的 f-字符串格式说明符 允许更细致地控制所要显示的表达式结果:

delta = date.today() - member_since
f’{user=!s} {delta.days=:,d}’
‘user=eric_idle delta.days=16,075’
= 说明符将输出整个表达式,以便详细演示计算过程:

print(f’{theta=} {cos(radians(theta))=:.3f}’)
theta=30 cos(radians(theta))=0.866
PEP 578: Python 运行时审核钩子
此 PEP 添加了审核钩子和已验证开放钩子。 两者在 Python 与本机代码中均可用。允许以纯 Python 代码编写的应用和框架利用额外的通知,同时允许嵌入开发人员或系统管理员部署始终启用审核的 Python 版本。

请参阅 PEP 578 了解详情。

PEP 587: Python 初始化配置
PEP 587 增加了一个新的 C API 用来配置 Python 初始化,提供对整个配置过程的更细致控制以及更好的错误报告。

新的结构:

PyConfig

PyPreConfig

PyStatus

PyWideStringList

新的函数:

PyConfig_Clear()

PyConfig_InitIsolatedConfig()

PyConfig_InitPythonConfig()

PyConfig_Read()

PyConfig_SetArgv()

PyConfig_SetBytesArgv()

PyConfig_SetBytesString()

PyConfig_SetString()

PyPreConfig_InitIsolatedConfig()

PyPreConfig_InitPythonConfig()

PyStatus_Error()

PyStatus_Exception()

PyStatus_Exit()

PyStatus_IsError()

PyStatus_IsExit()

PyStatus_NoMemory()

PyStatus_Ok()

PyWideStringList_Append()

PyWideStringList_Insert()

Py_BytesMain()

Py_ExitStatusException()

Py_InitializeFromConfig()

Py_PreInitialize()

Py_PreInitializeFromArgs()

Py_PreInitializeFromBytesArgs()

Py_RunMain()

此 PEP 还为这些内部结构添加了 _PyRuntimeState.preconfig (PyPreConfig 类型) 和 PyInterpreterState.config (PyConfig 类型) 字段。 PyInterpreterState.config 成为新的引用配置,替代全局配置变量和其他私有变量。
Vectorcall: 用于 CPython 的快速调用协议
添加 “vectorcall” 协议到 Python/C API。 它的目标是对已被应用于许多类的现有优化进行正式化。 任何实现可调用对象的扩展类型均可使用此协议。

此特性目前为暂定状态,计划在 Python 3.9 将其完全公开。

请参阅 PEP 590 了解详情。

(由 Jeroen Demeyer 和 Mark Shannon 在 bpo-36974 中贡献。)

具有外部数据缓冲区的 pickle 协议 5
当使用 pickle 在 Python 进程间传输大量数据以充分发挥多核或多机处理的优势时,非常重要一点是通过减少内存拷贝来优化传输效率,并可能应用一些定制技巧例如针对特定数据的压缩。

pickle 协议 5 引入了对于外部缓冲区的支持,这样 PEP 3118 兼容的数据可以与主 pickle 流分开进行传输,这是由通信层来确定的。

请参阅 PEP 574 了解详情。

(由 Antoine Pitrou 在 bpo-36785 中贡献。)

其他语言特性修改
在之前版本中 continue 语句不允许在 finally 子句中使用,这是因为具体实现存在一个问题。 在 Python 3.8 中此限制已被取消。 (由 Serhiy Storchaka 在 bpo-32489 中贡献。)

bool, int 和 fractions.Fraction 类型现在都有一个 as_integer_ratio() 方法,与 float 和 decimal.Decimal 中的已有方法类似。 这个微小的 API 扩展使得 numerator, denominator = x.as_integer_ratio() 这样的写法在多种数字类型上通用成为可能。 (由 Lisa Roach 在 bpo-33073 和 Raymond Hettinger 在 bpo-37819 中贡献。)

int, float 和 complex 的构造器现在会使用 index() 特殊方法,如果该方法可用而对应的方法 method int(), float() 或 complex() 方法不可用的话。 (由 Serhiy Storchaka 在 bpo-20092 中贡献。)

添加 \N{name} 转义符在 正则表达式 中的支持:

notice = ‘Copyright © 2019’
copyright_year_pattern = re.compile(r’\N{copyright sign}\s*(\d{4})’)
int(copyright_year_pattern.search(notice).group(1))
2019
(由 Jonathan Eunice 和 Serhiy Storchaka 在 bpo-30688 中贡献。)

现在 dict 和 dictview 可以使用 reversed() 按插入顺序反向迭代。 (由 Rémi Lapeyre 在 bpo-33462 中贡献。)

在函数调用中允许使用的关键字名称语法受到进一步的限制。 特别地,f((keyword)=arg) 不再被允许。 关键字参数赋值形式的左侧绝不允许一般标识符以外的其他内容。 (由 Benjamin Peterson 在 bpo-34641 中贡献。)

在 yield 和 return 语句中的一般可迭代对象解包不再要求加圆括号。 这使得 yield 和 return 的语法与正常的赋值语法更为一致:

def parse(family):
lastname, *members = family.split()
return lastname.upper(), *members

parse(‘simpsons homer marge bart lisa sally’)
(‘SIMPSONS’, ‘homer’, ‘marge’, ‘bart’, ‘lisa’, ‘sally’)
(由 David Cuthbert 和 Jordan Chapman 在 bpo-32117 中贡献。)

当类似 [(10, 20) (30, 40)] 这样在代码中少了一个逗号时,编译器将显示 SyntaxWarning 并附带更有帮助的提示。 这相比原来用 TypeError 来提示第一个元组是不可调用的更容易被理解。 (由 Serhiy Storchaka 在 bpo-15248 中贡献。)

datetime.date 或 datetime.datetime 和 datetime.timedelta 对象之间的算术运算现在将返回相应子类的实例而不是基类的实例。 这也会影响到在具体实现中(直接或间接地)使用了 datetime.timedelta 算术运算的返回类型,例如 astimezone()。 (由 Paul Ganssle 在 bpo-32417 中贡献。)

当 Python 解释器通过 Ctrl-C (SIGINT) 被中断并且所产生的 KeyboardInterrupt 异常未被捕获,Python 进程现在会通过一个 SIGINT 信号或是使得发起调用的进程能检测到它是由 Ctrl-C 操作杀死的正确退出代码来退出。 POSIX 和 Windows 上的终端会相应地使用此代码在交互式会话中终止脚本。 (由 Google 的 Gregory P. Smith 在 bpo-1054041 中贡献。)

某些高级编程风格要求为现有的函数更新 types.CodeType 对象。 由于代码对象是不可变的,需要基于现有代码对象模型创建一个新的代码对象。 使用 19 个形参将会相当繁琐。 现在,新的 replace() 方法使得通过少量修改的形参创建克隆对象成为可能。

下面是一个修改 statistics.mean() 函数来防止 data 形参被用作关键字参数的例子:

from statistics import mean
mean(data=[10, 20, 90])
40

mean.code = mean.code.replace(co_posonlyargcount=1)
mean(data=[10, 20, 90])
Traceback (most recent call last):

TypeError: mean() got some positional-only arguments passed as keyword arguments: ‘data’
(由 Victor Stinner 在 bpo-37032 中贡献。)

对于整数,现在 pow() 函数的三参数形式在底数与模数不可约的情况下允许指数为负值。 随后它会在指数为 -1 时计算底数的模乘逆元,并对其他负指数计算反模的适当幂次。 例如,要计算 38 模 137 的 模乘逆元 则可写为:

pow(38, -1, 137)
119

119 * 38 % 137
1
模乘逆元在求解 线性丢番图方程 会被用到。 例如,想要求出 4258𝑥 + 147𝑦 = 369 的整数解,首先应重写为 4258𝑥 ≡ 369 (mod 147) 然后求解:

x = 369 * pow(4258, -1, 147) % 147
y = (4258 * x - 369) // -147
4258 * x + 147 * y
369
(由 Mark Dickinson 在 bpo-36027 中贡献。)

字典推导式已与字典字面值实现同步,会先计算键再计算值:

Dict comprehension

cast = {input('role? '): input('actor? ') for i in range(2)}
role? King Arthur
actor? Chapman
role? Black Knight
actor? Cleese

Dict literal

cast = {input('role? '): input('actor? ')}
role? Sir Robin
actor? Eric Idle
对执行顺序的保证对赋值表达式来说很有用,因为在键表达式中赋值的变量将可在值表达式中被使用:

names = [‘Martin von Löwis’, ‘Łukasz Langa’, ‘Walter Dörwald’]
{(n := normalize(‘NFC’, name)).casefold() : n for name in names}
{‘martin von löwis’: ‘Martin von Löwis’,
‘łukasz langa’: ‘Łukasz Langa’,
‘walter dörwald’: ‘Walter Dörwald’}
(由 Jörn Heissler 在 bpo-35224 中贡献。)

object.reduce() 方法现在可返回长度为二至六个元素的元组。 之前的上限为五个。 新增的第六个可选元素是签名为 (obj, state) 的可调用对象。 这样就允许直接控制特定对象的状态更新。 如果元素值不为 None,该可调用对象将优先于对象的 setstate() 方法。 (由 Pierre Glaser 和 Olivier Grisel 在 bpo-35900 中贡献。)

新增模块
新增的 importlib.metadata 模块提供了从第三方包读取元数据的(临时)支持。 例如,它可以提取一个已安装软件包的版本号、入口点列表等等:

Note following example requires that the popular “requests”

package has been installed.

from importlib.metadata import version, requires, files
version(‘requests’)
‘2.22.0’

list(requires(‘requests’))
[‘chardet (❤️.1.0,>=3.0.2)’]

list(files(‘requests’))[:5]
[PackagePath(‘requests-2.22.0.dist-info/INSTALLER’),
PackagePath(‘requests-2.22.0.dist-info/LICENSE’),
PackagePath(‘requests-2.22.0.dist-info/METADATA’),
PackagePath(‘requests-2.22.0.dist-info/RECORD’),
PackagePath(‘requests-2.22.0.dist-info/WHEEL’)]
(由 Barry Warsaw 和 Jason R. Coombs 在 bpo-34632 中贡献)。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值