2021SC@SDUSC
四个模块
- OS模块
os 模块提供了非常丰富的方法用来处理文件和目录。
os 常用函数
os.getcwd()函数:获取当前目录,python 的工作目
os.name 函数:获取当前使用的操作系统(获取信息不够详细)
os.remove()函数:删除指定文件
os.removedirs()函数:删除指定目录
os.system()函数:运行shell命令
os.mkdir()函数:创建一个新目录
os.chdir()函数:改变当前路径到指定路径
os.listdir()函数:返回指定目录下的所有目录和文件
- sys模块
该模块提供对解释器使用或维护的一些变量的访问,以及与解释器强烈交互的函数,它始终可用。
常见用法
import sys
# 显示本地字节序的指示符。
print(sys.byteorder)
# 显示Python解释器有关的版权信息
print(sys.copyright)
# 显示Python解释器在磁盘上的存储路径。
print(sys.executable)
# 显示当前系统上保存文件所用的字符集。
print(sys.getfilesystemencoding())
# 显示Python整数支持的最大值
print(sys.maxsize)
# 显示Python解释器所在平台
print(sys.platform)
# 显示当前Python解释器的版本信息。
print(sys.version)
# 返回当前Python解释器的主版本号。
print(sys.winver)
- time
time模块包含了以下内置函数,既有时间处理相的,也有转换时间格式的
两个重要属性:
-
time.timezone 属性time.timezone是当地时区(未启动夏令时)距离格林威治的偏移秒数(>0,美洲;<=0大部分欧洲,亚洲,非洲)。
-
time.tzname 属性time.tzname包含一对根据情况的不同而不同的字符串,分别是带夏令时的本地时区名称,和不带的。
-
logging模块
模块logging,可以直接记录日志
logging.basicConfig()函数中的具体参数:
filename: 指定的文件名创建FiledHandler,这样日志会被存储在指定的文件中;
filemode: 文件打开方式,在指定了filename时使用这个参数,默认值为“w”还可指定为“a”
format: 指定handler使用的日志显示格式;
datefmt: 指定日期时间格式。,格式参考strftime时间格式化(下文)
level: 设置rootlogger的日志级别
stream: 用指定的stream创建StreamHandler。可以指定输出到sys.stderr,sys.stdout或者文件,默认为sys.stderr。
若同时列出了filename和stream两个参数,则stream参数会被忽略。
具体代码分析
模式选择
共涉及到四个方面的选择:
1、运行类型:train 或者 test
2、数据集选择: openkp 数据集 和 kp20k
3、模型选择:论文中的五个模型bert2span、bert2tag、bert2chunk、bert2rank、bert2joint
4、预训练模型的选择:bert-base-cased、spanbert-base-cased、roberta-base
modes = parser.add_argument_group('Modes')
modes.add_argument('--run_mode', type=str, choices=['train', 'test'],
help='Select running mode. ')
modes.add_argument('--dataset_class', type=str, choices=['openkp', 'kp20k'],
help='Select datasets.')
modes.add_argument('--model_class', type=str,
choices=['bert2span', 'bert2tag', 'bert2chunk', &