本文会试着介绍一些其它文章没有提到的小技巧,这些小技巧也是我平时会用到的的。让咱们一探究竟吧!正则表达式
整理字符串输入
整理用户输入的问题在编程过程当中极为常见。一般状况下,将字符转换为小写或大写就够了,有时你可使用正则表达式模块「Regex」完成这项工做。可是若是问题很复杂,可能有更好的方法来解决:编程
user_input = "This
string has some whitespaces...
"
character_map = {
ord(
) : ,
ord( ) : ,
ord(
) : None
}
user_input.translate(character_map) # This string has some whitespaces...
在本例中,你能够看到空格符「 n」和「 t」都被替换成了单个空格,「 r」都被删掉了。这只是个很简单的例子,咱们能够更进一步,使用「unicodedata」程序包生成大型重映射表,并使用其中的「combining()」进行生成和映射,咱们能够数组
迭代器切片(Slice)
若是对迭代器进行切片操做,会返回一个「TypeError」,提示生成器对象没有下标,可是咱们能够用一个简单的方案来解决这个问题:ide
import itertools
s = itertools.islice(range(50), 10, 20) # <itertools.islice object at 0x7f70fab88138>
for val in s:
...
咱们可使用「itertools.islice」建立一个「islice」对象,该对象是一个迭代器,能够产生咱们想要的项。但须要注意的是,该操做要使用切片以前的全部生成器项,以及「islice」对象中的全部项。函数
跳过可迭代对象的开头
有时你要处理一些以不须要的行(如注释)开头的文件。「itertools」再次提供了一种简单的解决方案:优化
string_from_file = """
// Author: ...
// License: ...
//
// Date: ...
Actual content...
"""
import itertools
for line in itertools.dropwhile(lambda line: line.startswith("//"), string_from_file.split("
")):
print(line)
这段代码只打印初始注释部分以后的内容。若是咱们只想舍弃可迭代对象的开头部分(本示例中为开头的注释行),而又不知道要这部分有多长时,这种方法就颇有用了。spa
只包含关键字参数的函数 (kwargs)
当咱们使用下面的函数时,建立仅仅须要关键字参数做为输入的函数来提供更清晰的函数定义,会颇有帮助:code
def test(*, a, b):
pass
test("value for a", "value for b") # TypeError: test() takes 0 positional arguments...
test(a="value", b="value 2") # Works...
如你所见,在关键字参数以前加上一个「」就能够解决这个问题。若是咱们将某些参数放在「」参数以前,它们显然是位置参数。对象
建立支持「with」语句的对象
举例而言,咱们都知道如何使用「with」语句打开文件或获取锁,可是咱们能够实现本身上下文表达式吗?是的,咱们可使用「enter」和「exit」来实现上下文管理协议:blog
class Connection:
def __init__(self):
...
def __enter__(self):
# Initialize connection...
def __exit__(self, type, value, traceback):
# Close connection...
with Connection() as c:
# __enter__() executes
...
# conn.__exit__() executes
这是在 Python 中最多见的实现上下文管理的方法,可是还有更简单的方法:
from contextlib import contextmanager
@contextmanager
def tag(name):
print(f"")
yield
print(f"{name}>")
with tag("h1"):
print("This is Title.")
上面这段代码使用 contextmanager 的 manager 装饰器实现了内容管理协议。在进入 with 块时 tag 函数的第一部分(在 yield 以前的部分)就已经执行了,而后 with 块才被执行,最后执行 tag 函数的其他部分。
用「slots」节省内存
若是你曾经编写过一个建立了某种类的大量实例的程序,那么你可能已经注意到,你的程序忽然须要大量的内存。那是由于 Python 使用字典来表示类实例的属性,这使其速度很快,但内存使用效率却不是很高。一般状况下,这并非一个严重的问题。可是,若是你的程序所以受到严重的影响,不妨试一下「slots」:
class Person:
__slots__ = ["first_name", "last_name", "phone"]
def __init__(self, first_name, last_name, phone):
self.first_name = first_name
self.last_name = last_name
self.phone = phone
当咱们定义了「slots」属性时,Python 没有使用字典来表示属性,而是使用小的固定大小的数组,这大大减小了每一个实例所需的内存。使用「slots」也有一些缺点:咱们不能声明任何新的属性,咱们只能使用「slots」上现有的属性。并且,带有「slots」的类不能使用多重继承。
限制「CPU」和内存使用量
若是不是想优化程序对内存或 CPU 的使用率,而是想直接将其限制为某个肯定的数字,Python 也有一个对应的库能够作到:
import signal
import resource
import os
# To Limit CPU time
def time_exceeded(signo, frame):
print("CPU exceeded...")
raise SystemExit(1)
def set_max_runtime(seconds):
# Install the signal handler and set a resource limit
soft, hard = resource.getrlimit(resource.RLIMIT_CPU)
resource.setrlimit(resource.RLIMIT_CPU, (seconds, hard))
signal.signal(signal.SIGXCPU, time_exceeded)
# To limit memory usage
def set_max_memory(size):
soft, hard = resource.getrlimit(resource.RLIMIT_AS)
resource.setrlimit(resource.RLIMIT_AS, (size, hard))
咱们能够看到,在上面的代码片断中,同时包含设置最大 CPU 运行时间和最大内存使用限制的选项。在限制 CPU 的运行时间时,咱们首先得到该特定资源(RLIMIT_CPU)的软限制和硬限制,而后使用经过参数指定的秒数和先前检索到的硬限制来进行设置。最后,若是 CPU 的运行时间超过了限制,咱们将发出系统退出的信号。在内存使用方面,咱们再次检索软限制和硬限制,并使用带「size」参数的「setrlimit」和先前检索到的硬限制来设置它。
控制能够/不能够导入什么
有些语言有很是明显的机制来导出成员(变量、方法、接口),例如在 Golang 中只有以大写字母开头的成员被导出。然而,在 Python 中,全部成员都会被导出(除非咱们使用了「all」):
def foo():
pass
def bar():
pass
__all__ = ["bar"]
在上面这段代码中,咱们知道只有「bar」函数被导出了。一样,咱们可让「all」为空,这样就不会导出任何东西,当从这个模块导入的时候,会形成「AttributeError」。
实现比较运算符的简单方法
为一个类实现全部的比较运算符(如 lt , le , gt , ge)是很繁琐的。有更简单的方法能够作到这一点吗?这种时候,「functools.total_ordering」就是一个很好的帮手:
from functools import total_ordering
@total_ordering
class Number:
def __init__(self, value):
self.value = value
def __lt__(self, other):
return self.value < other.value
def __eq__(self, other):
return self.value == other.value
print(Number(20) > Number(3))
print(Number(1) < Number(5))
print(Number(15) >= Number(15))
print(Number(10) <= Number(2))
这里的工做原理到底是怎样的呢?咱们用「total_ordering」装饰器简化实现对类实例排序的过程。咱们只须要定义「lt」和「eq」就能够了,它们是实现其他操做所须要的最小的操做集合(这里也体现了装饰器的做用——为咱们填补空白)。
结语
并不是本文中全部提到的功能在平常的 Python 编程中都是必需或有用的,可是其中某些功能可能会不时派上用场,并且它们也可能简化一些本来就很冗长且使人烦恼的任务。还需指出的是,全部这些功能都是 Python 标准库的一部分。而在我看来,其中一些功能彷佛并不像标准库中包含的标准内容,因此当你使用 Python 实现本文提到的某些功能时,请先参阅 Python 的标准库,若是你不能找到想要的功能,可能只是由于你尚未尽力查找(若是真的没有,那它确定也存在于一些第三方库)。