但是 print 只会将内容输出到终端上,不能持久化到日志文件中,并不利于问题的排查。
如果你热衷于使用 print 来调试代码(虽然这并不是最佳做法),记录程序运行过程,那么下面介绍的这个 print 用法,可能会对你有用。
Python 3 中的 print 作为一个函数,由于可以接收更多的参数,所以功能变为更加强大,指定一些参数可以将 print 的内容输出到日志文件中。
>>> with open('test.log', mode='w') as f:
... print('hello, python', file=f, flush=True)
>>> exit()
$ cat test.log
hello, python
2、正则表达式基本配方
import re
pattern = re.compile(r”\d\d”)
print(re.search(pattern,"Let's find the number 23").group())
# or
print(re.findall(pattern, “Let's find the number 23”))[0]
# Outputs
'23'
'23'
Regex 对于许多 python 管道来说都是必须的,所以记住***核心Regex方法***很有用处。
3、将嵌套 for 循环写成单行
我们经常会如下这种嵌套的 for 循环代码
list1 = range(1,3)
list2 = range(4,6)
list3 = range(7,9)
for item1 in list1:
for item2 in list2:
for item3 in list3:
print(item1+item2+item3)
这里仅仅是三个 for 循环,在实际编码中,有可能会有更层。这样的代码,可读性非常的差,很多人不想这么写,可又没有更好的写法。
这里介绍一种常用的写法,***使用 itertools 这个库***来实现更优雅易读的代码。
from itertools import product
list1 = range(1,3)
list2 = range(4,6)
list3 = range(7,9)
for item1,item2,item3 in product(list1, list2, list3):
print(item1+item2+item3)
输出:
$ python demo.py
12
13
13
14
13
14
14
15
4、如何在运行状态查看源代码?
查看函数的源代码,我们通常会使用 IDE 来完成。比如在 PyCharm 中,你可以 Ctrl + 鼠标点击 进入函数的源代码。
那如果没有 IDE 呢?想使用一个函数时,如何知道这个函数需要接收哪些参数呢?
这时可以使用 *inspect 来代替 IDE* 帮助你完成这些事
# demo.py
import inspect
def add(x, y):
return x + y
print("===================")
print(inspect.getsource(add))
运行结果:
$ python demo.py
===================
def add(x, y):
return x + y
这里我想先说一个点:不管你是通过各种渠道学Python还是自学?还是说你大学在学习,甚至于说有别的编程的基础,一定要注重一个东西:*完整的知识体系*。对于每一个自学的人,按照这个体系去打好基础,你未来的路会走得更稳重。
适用人群:零基础 / 基础不扎实者,学Python都从这里开始
零基础如何开始学习 Python?看完这篇从小白变大牛【内附干货资料】
5、最快查看包搜索路径的方式
当你使用 import 导入一个包或模块时,Python 会去一些目录下查找,而这些目录是有优先级顺序的,正常人会使用 sys.path 查看。
>>> import sys
>>> from pprint import pprint
>>> pprint(sys.path)
['',
'/usr/local/Python3.7/lib/python37.zip',
'/usr/local/Python3.7/lib/python3.7',
'/usr/local/Python3.7/lib/python3.7/lib-dynload',
'/home/wangbm/.local/lib/python3.7/site-packages',
'/usr/local/Python3.7/lib/python3.7/site-packages']
>>>
有没有更快的方式呢?一行命令即可解决!
[wangbm@localhost ~]$ python3 -m site
sys.path = [
'/home/wangbm',
'/usr/local/Python3.7/lib/python37.zip',
'/usr/local/Python3.7/lib/python3.7',
'/usr/local/Python3.7/lib/python3.7/lib-dynload',
'/home/wangbm/.local/lib/python3.7/site-packages',
'/usr/local/Python3.7/lib/python3.7/site-packages',
]
USER_BASE: '/home/wangbm/.local' (exists)
USER_SITE: '/home/wangbm/.local/lib/python3.7/site-packages' (exists)
ENABLE_USER_SITE: True
从输出你可以发现,这个列的路径会比 sys.path 更全,它包含了用户环境的目录。
6、如何快速计算函数运行时间
计算一个函数的运行时间,有人可能会这样写:
import time
start = time.time()
# run the function
end = time.time()
print(end-start)
你看看你为了计算函数运行时间,写了几行代码了?
有没有可以更方便计算的呢?
***内置模块叫 timeit!***使用它,只用一行代码即可
import time
import timeit
def run_sleep(second):
print(second)
time.sleep(second)
# 只用这一行
print(timeit.timeit(lambda :run_sleep(2), number=5))
运行结果
2
2
2
2
2
10.020059824
7、partial 函数
from functools import partial
def multiply(x,y):
return x*y
dbl = partial(multiply,2)
print(dbl)
print(dbl(4))
# Outputs
functools.partial(<function multiply at 0x7f16be9941f0>, 2)
8
在这里,我们创建一个函数,它复制另一个函数,但使用的参数比原始函数少,这样就可以使用它将该参数应用于多个不同的参数。
8、使用 hasattr() 内置方法获取object属性
class SomeClass:
def __init__(self):
self.attr1 = 10
def attrfunction(self):
print("Attreibute")
hasattr(SomeClass, "attrfunction")
# Output
True
9、使用 defaultdict 和 lambda 函数创建字典
from collections import defaultdict
import numpy as np
q = defaultdict(lambda: np.zeros(5))
# Example output
In : q[0]
Out: array([0., 0., 0., 0., 0.])
defaultdicts不会引发KeyError,任何不存在的键都会获取默认工厂返回的值。
在上述代码,默认工厂是一个lambda函数,它为给定的任何键返回一个默认NumPy数组,其中包含5个零。
10、使用集合从两个列表中获得差异
list1 = [1,2,3,4,5]
list2 = [3,4,5]
print(list(set(list1) — set(list2)))
# or
print(set(lista1).difference(set(lista2)))
# Outputs
[1,2]
{1,2}
在这里,集合有助于获得两个python列表之间的差异,这两个列表既是一个列表,也是一个集合。
11、使用isinstance()检查变量是否为给定类型
isinstance(1, int)
#Output
True
12、使用map()打印列表中的数字
一种比循环打印列表内容更快更有效的方法
list1 = [1,2,3]
list(map(print, list1))
# Output
1
2
3
13、使用.join()方法格式化datetime日期
from datetime import datetime
date = datetime.now()
print("-".join([str(date.year), str(date.month), str(date.day)])
14、将两个具有相同规则的列表随机化
import numpy as np
x = np.arange(100)
y = np.arange(100,200,1)
idx = np.random.choice(np.arange(len(x)), 5, replace=False)
x_sample = x[idx]
y_sample = y[idx]
print(x_sample)
print(y_sample)
# Outputs
array([68, 87, 41, 16, 0])
array([168, 187, 141, 116, 100])
15、对输入的字符串“消毒”
对用户输入的内容“消毒”,这问题几乎适用于你编写的所有程序。
通常将字符转换为小写或大写就足够了,有时还可以使用正则表达式来完成工作,但是对于复杂的情况,还有更好的方法:
user_input = "This\nstring has\tsome whitespaces...\r\n"
character_map = {
ord('\n') : ' ',
ord('\t') : ' ',
ord('\r') : None
}
user_input.translate(character_map) # This string has some whitespaces... "
在上述代码,可以看到空格字符“ \n”和“ \t”被单个空格替换了,而“ \r”则被完全删除。
这是一个简单的示例,但是我们可以更进一步,使用unicodedata
库及其 combining() 函数,来生成更大的重映射表(remapping table),并用它来删除字符串中所有的重音。
16、反转字符串
编写一些代码来反转字符串
def reverse_string(string):
result=""
for c in range(len(string),-1,-1):
result = result + string[c]
return result
看起来有点乱吧, 用另一种方式来表达:
def reverse_string(string):
result = [ string[c] for c in range(len(string),-1,-1)]
return "".join(result)
看起来不错吧,其实使用切片的方法可以更好,方法如下:
def reverse_string(string):
return string[::-1]
17、将数字与数字进行求和
将数字与数字进行求和,这是一个非常简单的问题,我们可以用传统方法解决这个问题:
def sum_a_num(num):
sum = 0
while num > 0:
sum+= num%10
num//=10
return sum
这是可以的,但在紧张的情况下,最终可能会与运算符发生拼写错误或错误,最终得到错误的结果,并花费数小时尝试调试代码。
想要避免这种情况,有一个更好的方法做到这一点:
def sum_a_num(num):
return sum(list(map(int,str(num))))
上述代码所做的是:
- 将 num 转换为字符串;
- map() 函数在字符串上遍数,并将每个字符转换为整数;
- list() 函数将映射对象转换为列表,然后求和;
num = 2367
str(num) = '2367'
list(map(int,str(num))) = [2,3,6,7]
sum(list(map(int(str(num)))) = 18
18、仅支持关键字参数(kwargs)的函数
当需要函数提供(强制)更清晰的参数时,创建仅支持关键字参数的函数,可能会挺有用:
def test(*, a, b):
pass
test("value for a", "value for b") # TypeError: test() takes 0 positional arguments...
test(a="value", b="value 2") # Works...
如上所见,可以在关键字参数之前,放置单个 * 参数来轻松解决此问题,如果我们将位置参数放在 * 参数之前,则显然也可以有位置参数。
19、使用slice函数命名切片
使用大量硬编码的索引值会很快搞乱维护性和可读性,一种做法是对所有索引值使用常量,但是我们可以做得更好:
# ID First Name Last Name
line_record = "2 John Smith"
ID = slice(0, 8)
FIRST_NAME = slice(9, 21)
LAST_NAME = slice(22, 27)
name = f"{line_record[FIRST_NAME].strip()} {line_record[LAST_NAME].strip()}"
# name == "John Smith"
在此例中,我们可以避免神秘的索引,方法是先使用 slice 函数命名它们,然后再使用它们,还可以通过 .start、.stop和 .stop 属性,来了解 slice 对象的更多信息。
20、在运行时提示用户输入密码
许多命令行工具或脚本需要用户名和密码才能操作。因此,如果你碰巧写了这样的程序,你可能会发现 getpass 模块很有用:
import getpass
user = getpass.getuser()
password = getpass.getpass()
# Do Stuff...
这个非常简单的包通过提取当前用户的登录名,可以提示用户输入密码,但是须注意,并非每个系统都支持隐藏密码。Python 会尝试警告你,因此切记在命令行中阅读警告信息。
21、用__slots__节省内存
如果你曾经编写过一个程序,该程序创建了某个类的大量实例,那么你的程序突然就会需要大量内存。那是因为 Python 使用字典来表示类实例的属性,这能使其速度变快,但内存不是很高效。
通常这不是个问题,但是,如果你的程序遇到了问题,你可以尝试使用__slots__ :
class Person:
__slots__ = ["first_name", "last_name", "phone"]
def __init__(self, first_name, last_name, phone):
self.first_name = first_name
self.last_name = last_name
self.phone = phone
这里发生的是,当我们定义__slots__属性时,Python 使用固定大小的小型数组,而不是字典,这大大减少了每个实例所需的内存。
使用__slots__还有一些缺点——我们无法声明任何新的属性,并且只能使用在__slots__中的属性。
同样,带有__slots__的类不能使用多重继承。
22、限制CPU和内存使用量
一、Python所有方向的学习路线
Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
二、学习软件
工欲善其事必先利其器。学习Python常用的开发软件都在这里了,给大家节省了很多时间。
三、入门学习视频
我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!