1. 什么是模块
Python 模块(Module),是一个 Python 文件,以 .py 结尾,包含了 Python 对象定义和Python语句。
- 容器 -> 数据的封装
- 函数 -> 语句的封装
- 类 -> 方法和属性的封装
- 模块 -> 程序文件
2. 命名空间
命名空间因为对象的不同,也有所区别,可以分为如下几种:
- 内置命名空间(Built-in Namespaces):Python 运行起来,它们就存在了。内置函数的命名空间都属于内置命名空间,所以,我们可以在任何程序中直接运行它们,比如
id()
,不需要做什么操作,拿过来就直接使用了。 - 全局命名空间(Module:Global Namespaces):每个模块创建它自己所拥有的全局命名空间,不同模块的全局命名空间彼此独立,不同模块中相同名称的命名空间,也会因为模块的不同而不相互干扰。
- 本地命名空间(Function & Class:Local Namespaces):模块中有函数或者类,每个函数或者类所定义的命名空间就是本地命名空间。如果函数返回了结果或者抛出异常,则本地命名空间也结束了。
- 程序在查询上述三种命名空间的时候,就按照从里到外的顺序,即:Local Namespaces --> Global Namesspaces --> Built-in Namesspaces。
3. 导入模块
# TemperatureConversion.py
def c2f(cel):
fah = cel * 1.8 + 32
return fah
def f2c(fah):
cel = (fah - 32) / 1.8
return cel
将其保存在TemperatureConversion.py
方法1:import 模块名
import TemperatureConversion
print('32摄氏度 = %.2f华氏度' % TemperatureConversion.c2f(32))
print('99华氏度 = %.2f摄氏度' % TemperatureConversion.f2c(99))
# 32摄氏度 = 89.60华氏度
# 99华氏度 = 37.22摄氏度
方法二:from 模块 import 函数名
from TemperatureConversion import c2f, f2c
print('32摄氏度 = %.2f华氏度' % c2f(32))
print('99华氏度 = %.2f摄氏度' % f2c(99))
# 32摄氏度 = 89.60华氏度
# 99华氏度 = 37.22摄氏度
4. if __name__ == '__main__'
对于很多编程语言来说,程序都必须要有一个入口,而 Python 则不同,它属于脚本语言,不像编译型语言那样先将程序编译成二进制再运行,而是动态的逐行解释运行。也就是从脚本第一行开始运行,没有统一的入口。
# const .py
PI = 3.14
def main():
print("PI:", PI)
main()
# PI: 3.14
from const import PI
def calc_round_area(radius):
return PI * (radius ** 2)
def main():
print("round area: ", calc_round_area(2))
main()
'''
PI: 3.14
round area: 12.56
'''
const.py 做如下修改:
PI = 3.14
def main():
print("PI:", PI)
if __name__ == "__main__":
main()
运行 area.py,输出如下:
round area: 12.56
__name__
:是内置变量,可用于表示当前模块的名字。
import const
print(__name__)
# __main__
print(const.__name__)
# const
由此我们可知:如果一个 .py 文件(模块)被直接运行时,其__name__
值为__main__
,即模块名为__main__
。
所以,if __name__ == '__main__'
的意思是:当 .py 文件被直接运行时,if __name__ == '__main__'
之下的代码块将被运行;当 .py 文件以模块形式被导入时,if __name__ == '__main__'
之下的代码块不被运行。
5. 搜索路径
当解释器遇到 import 语句,如果模块在当前的搜索路径就会被导入。
搜索路径是在 Python 编译或安装的时候确定的,安装新的库应该也会修改。搜索路径被存储在 sys
模块中的 path
变量中。
6. 包(package)
包是一种管理 Python 模块命名空间的形式,采用"点模块名称"。
创建包分为三个步骤:
- 创建一个文件夹,用于存放相关的模块,文件夹的名字即包的名字。
- 在文件夹中创建一个
__init__.py
的模块文件,内容可以为空。 - 将相关的模块放入文件夹中。
sound/ 顶层包
__init__.py 初始化 sound 包
formats/ 文件格式转换子包
__init__.py
wavread.py
wavwrite.py
aiffread.py
aiffwrite.py
auread.py
auwrite.py
...
effects/ 声音效果子包
__init__.py
echo.py
surround.py
reverse.py
...
filters/ filters 子包
__init__.py
equalizer.py
vocoder.py
karaoke.py
...
7、Collection(https://www.jianshu.com/p/8acb163dd1fe)
-
collections中defaultdict的使用
defaultdict在字典dict的基础之上添加一个参数default_factory(default_factory可以指定为list,set,int)
例子1:将下面的list转换成一个dict,其中key对应的value是一个list
from collections import defaultdict
l=[('a',2),('b',3),('a',1),('b',4),('a',3),('a',1),('b',3)]
d=defaultdict(list)
for key,value in l:
d[key].append(value)
d
##defaultdict(list, {'a': [2, 1, 3, 1], 'b': [3, 4, 3]})
例子2:例1中value中包含重复元素,如果我们不想要value中的元素重复,可以用defaultdict(set)来解决这个问题,set与list不同之处就是set中不允许存在相同的元素。
d = defaultdict(set)
for key,value in l:
d[key].add(value)
d
# defaultdict(set, {'a': {1, 2, 3}, 'b': {3, 4}})
例子3:如果要统计一个字符串中每个字符出现的次数,可以使用defaultdict(int)
sen='hello world'
d=defaultdict(int)
for key in sen:
d[key]+=1
d
# defaultdict(int,{'h': 1, 'e': 1, 'l': 3, 'o': 2, ' ': 1, 'w': 1, 'r': 1, 'd': 1})
2、collections中OrdereDict的使用
sorted(iterable,key,reverse),sorted一共有iterable,key,reverse这三个参数。其中iterable表示可以迭代的对象,例如可以是dict.items()、dict.keys()等,key是一个函数,用来选取参与比较的元素,reverse则是用来指定排序是倒序还是顺序,reverse=true则是倒序,reverse=false时则是顺序,默认时reverse=false。
下面我们利用sorted函数按key,value值对字典排序
字典dict是无序的,如果我们想要有序的dict,可以使用OrdereDict 。
from collections import OrderedDict
d={'b':3,'a':4,'c':2,'d':1}
# 将d按照key来排序
OrderedDict(sorted(d.items(),key=lambda t:t[0]))
#OrderedDict([('a',4),('b',3),('c',2),('d',1)])
# 按照value来排序
OrderedDict(sorted(d.items(),key=lambda t:t[1]))
#OrderedDict([('d',1),('c',2),('b',3),('a',4)])
例子2:例1中已经按照key排序的dict,使用使用popitem()方法来移除最后一个key-value对.如果我们要删除dict中的key-value,popitem(last=True)按照先进后出的顺序删除dict中的key-value,popitem(last=False)按照先进先出的规则删除dict中的key-value.
3、collections中deque的使用
deque是为了向list中删除和插入的效率更高,用法与list相似,而list自带的append和pop方法(尾部插入和删除)速度慢
4、collections中ChainMap的使用
ChainMap可以合并多个dict,而且效率很高
from collections import ChainMap
a = {'a': 4, 'c': 2}
b = {'b': 3, 'c': 1}
c=ChainMap(a,b)
c
# ChainMap({'a': 4, 'c': 2}, {'b': 3, 'c': 1})
# 将c变成一个list
c.maps
# [{'a': 4, 'c': 2}, {'b': 3, 'c': 1}]
from collections import Counter
cnt=Counter()
for w in ['a','b','a','a','a','r','b']:
cnt[w]+=1
cnt
# Counter({'a': 4, 'b': 2, 'r': 1})
5、collections中Counter的使用
例子1:若想统计相关元素出现的次数,可以使用Counter或者用deafultdict
from collections import Cointer
cnt=Counter()
for w in language:
cnt[w]+=1
cnt
例子2:elements()方法按照元素的出现次数返回一个iterator(迭代器),元素以任意的顺序返回,如果元素的计数小于1,将忽略它。
c = Counter(a=4, b=3, c=1, d=-4,e=0)
print(c)
# Counter({'a': 4, 'b': 3, 'c': 1, 'd': -4, 'e':0})
print(sorted(c.elements()))
# ['a', 'a', 'a', 'a', 'b', 'b','b','c']
# # most_common(n)返回一个list, list中包含Counter对象中出现最多前n个元素。
c = Counter('abracadabra')
c
# Counter({'a': 5, 'b': 2, 'r': 2, 'd': 1, 'c': 1})
c.most_common(3)
# [('a', 5), ('b', 2), ('r', 2)]
6、collections中namedtuple的使用
命名tuple中的元素,使用namedtuple(typename,field_names)
from collections import namedtuple
nm=namedtuple('helloworld',['x','y'])
n=nm(1,2)
n.__class__.__name__
n.x
n.y
题目说明:
输入:language = ['PHP', 'PHP', 'Python', 'PHP', 'Python', 'JS', 'Python', 'Python','PHP', 'Python']
输出:Python
直接调用方法:
from collections import Counter
c = Counter(language)
c.most_common(1)[0][0]
"""
Input file
language = ['PHP', 'PHP', 'Python', 'PHP', 'Python', 'JS', 'Python', 'Python','PHP', 'Python']
Output file
Python
"""
def most_element(language):
""" Return a list of lines after inserting a word in a specific line. """
from collections import defaultdict
from collections import OrderedDict
d=defaultdict(int)
for key in language:
d[key]+=1
# d
d=OrderedDict(sorted(d.items(),key=lambda t:t[1]))
return d.popitem()[0]
# your code here
language = ['PHP', 'PHP', 'Python', 'PHP', 'Python', 'JS', 'Python', 'Python','PHP', 'Python']
most_element(language)
datetime模块
datetime 是 Python 中处理日期的标准模块,它提供了 4 种对日期和时间进行处理的类:datetime、date、time 和 timedelta。
1. datetime类
class datetime(date): def __init__(self, year, month, day, hour, minute, second, microsecond, tzinfo) pass def now(cls, tz=None): pass def timestamp(self): pass def fromtimestamp(cls, t, tz=None): pass def date(self): pass def time(self): pass def year(self): pass def month(self): pass def day(self): pass def hour(self): pass def minute(self): pass def second(self): pass def isoweekday(self): pass def strftime(self, fmt): pass def combine(cls, date, time, tzinfo=True): pass
例子】如何创建一个 datetime 对象?
import datetime dt = datetime.datetime(year=2020, month=6, day=25, hour=11, minute=23, second=59) print(dt) # 2020-06-25 11:23:59 print(dt.timestamp()) # 1593055439.0 dt = datetime.datetime.fromtimestamp(1593055439.0) print(dt) # 2020-06-25 11:23:59 print(type(dt)) # <class 'datetime.datetime'> dt = datetime.datetime.now() print(dt) # 2020-06-25 11:11:03.877853 print(type(dt)) # <class 'datetime.datetime'>
符号 | 说明 |
---|---|
%a | 本地简化星期名称(如星期一,返回 Mon) |
%A | 本地完整星期名称(如星期一,返回 Monday) |
%b | 本地简化的月份名称(如一月,返回 Jan) |
%B | 本地完整的月份名称(如一月,返回 January) |
%c | 本地相应的日期表示和时间表示 |
%d | 月内中的一天(0-31) |
%H | 24小时制小时数(0-23) |
%I | 12小时制小时数(01-12) |
%j | 年内的一天(001-366) |
%m | 月份(01-12) |
%M | 分钟数(00-59) |
%p | 本地A.M.或P.M.的等价符 |
%S | 秒(00-59) |
%U | 一年中的星期数(00-53)星期天为星期的开始 |
%w | 星期(0-6),星期天为星期的开始 |
%W | 一年中的星期数(00-53)星期一为星期的开始 |
%x | 本地相应的日期表示 |
%X | 本地相应的时间表示 |
%y | 两位数的年份表示(00-99) |
%Y | 四位数的年份表示(0000-9999) |
%Z | 当前时区的名称(如果是本地时间,返回空字符串) |
%% | %号本身 |
【例子】如何将 datetime 对象转换为任何格式的日期?
import datetime dt = datetime.datetime(year=2020, month=6, day=25, hour=11, minute=51, second=49) s = dt.strftime("'%Y/%m/%d %H:%M:%S") print(s) # '2020/06/25 11:51:49 s = dt.strftime('%d %B, %Y, %A') print(s) # 25 June, 2020, Thursday
【练习】如何将给定日期转换为 "mmm-dd, YYYY" 的格式?
# 输入 d1 = datetime.date('2010-09-28') # 输出 'Sep-28,2010'
import datetime
d1 = datetime.date(2010, 9, 28)
print(d1.strftime('%b-%d,%Y'))
# Sep-28,2010
【例子】datetime 对象包含很多与日期时间相关的实用功能。
import datetime dt = datetime.datetime(year=2020, month=6, day=25, hour=11, minute=51, second=49) print(dt.date()) # 2020-06-25 print(type(dt.date())) # <class 'datetime.date'> print(dt.time()) # 11:51:49 print(type(dt.time())) # <class 'datetime.time'> print(dt.year) # 2020 print(dt.month) # 6 print(dt.day) # 25 print(dt.hour) # 11 print(dt.minute) # 51 print(dt.second) # 49 print(dt.isoweekday()) # 4
在处理含有字符串日期的数据集或表格时,我们需要一种自动解析字符串的方法,无论它是什么格式的,都可以将其转化为 datetime 对象。这时,就要使用到 dateutil 中的 parser 模块。
【例子】如何在 python 中将字符串解析为 datetime对象?
from dateutil import parser
s = '2020-06-25'
dt = parser.parse(s)
print(dt) # 2020-06-25 00:00:00
print(type(dt)) # <class 'datetime.datetime'>
s = 'March 31, 2010, 10:51pm'
dt = parser.parse(s)
print(dt) # 2010-03-31 22:51:00
print(type(dt)) # <class 'datetime.datetime'>
【练习】计算以下列表中连续的天数。(使用np.diff函数就是执行的是后一个元素减去前一个元素)
# 输入 ['Oct, 2, 1869', 'Oct, 10, 1869', 'Oct, 15, 1869', 'Oct, 20, 1869','Oct, 23, 1869'] # 输出 [8, 5, 5, 3]
import numpy as np
from dateutil import parser
dateString = ['Oct, 2, 1869', 'Oct, 10, 1869', 'Oct, 15, 1869', 'Oct, 20, 1869', 'Oct, 23, 1869']
dates = [parser.parse(i) for i in dateString]
td = np.diff(dates)
print(td)
# [datetime.timedelta(days=8) datetime.timedelta(days=5)
# datetime.timedelta(days=5) datetime.timedelta(days=3)]
d = [i.days for i in td]
print(d) # [8, 5, 5, 3]
2. date类
class date: def __init__(self, year, month, day): pass def today(cls): pass
【例子】如何在 Python 中获取当前日期和时间?
import datetime
d = datetime.date(2020, 6, 25)
print(d) # 2020-06-25
print(type(d)) # <class 'datetime.date'>
d = datetime.date.today()
print(d) # 2020-06-25
print(type(d)) # <class 'datetime.date'>
【练习】如何统计两个日期之间有多少个星期六?
import datetime
d1 = datetime.date(1869, 1, 2)
d2 = datetime.date(1869, 10, 2)
dt = (d2 - d1).days
print(dt)
print(d1.isoweekday()) # 6
print(dt // 7 + 1) # 40
3. time类
class time: def __init__(self, hour, minute, second, microsecond, tzinfo): pass
【例子】如何使用 datetime.time() 类?
import datetime t = datetime.time(12, 9, 23, 12980) print(t) # 12:09:23.012980 print(type(t)) # <class 'datetime.time'>
【练习】如何将给定日期转换为当天开始的时间?
import datetime
date = datetime.date(2019, 10, 2)
dt = datetime.datetime(date.year, date.month, date.day)
print(dt) # 2019-10-02 00:00:00
dt = datetime.datetime.combine(date, datetime.time.min)
print(dt) # 2019-10-02 00:00:00
4. timedelta类
timedelta
表示具体时间实例中的一段时间。你可以把它们简单想象成两个日期或时间之间的间隔。
它常常被用来从 datetime
对象中添加或移除一段特定的时间。
class timedelta(SupportsAbs[timedelta]): def __init__(self, days, seconds, microseconds, milliseconds, minutes, hours, weeks,): pass def days(self): pass def total_seconds(self): pass
【例子】如何使用 datetime.timedelta() 类?
import datetime
td = datetime.timedelta(days=30)
print(td) # 30 days, 0:00:00
print(type(td)) # <class 'datetime.timedelta'>
print(datetime.date.today()) # 2020-07-01
print(datetime.date.today() + td) # 2020-07-31
dt1 = datetime.datetime(2020, 1, 31, 10, 10, 0)
dt2 = datetime.datetime(2019, 1, 31, 10, 10, 0)
td = dt1 - dt2
print(td) # 365 days, 0:00:00
print(type(td)) # <class 'datetime.timedelta'>
td1 = datetime.timedelta(days=30) # 30 days
td2 = datetime.timedelta(weeks=1) # 1 week
td = td1 - td2
print(td) # 23 days, 0:00:00
print(type(td)) # <class 'datetime.timedelta'>
-
datetime.now(tz=None)
获取当前的日期时间,输出顺序为:年、月、日、时、分、秒、微秒。datetime.timestamp()
获取以 1970年1月1日为起点记录的秒数。datetime.fromtimestamp(tz=None)
使用 unixtimestamp 创建一个 datetime。
datetime.strftime(fmt)
格式化 datetime 对象。
datetime.date()
Return the date part.datetime.time()
Return the time part, with tzinfo None.datetime.year
年datetime.month
月datetime.day
日datetime.hour
小时datetime.minute
分钟datetime.second
秒datetime.isoweekday
星期几
parser.parse(timestr, parserinfo=None, **kwargs)
date.today()
获取当前日期信息。