logging
虽然自己打印错误信息也很简单,但是学着用标准的东西总没错!
import logging
LOG_FORMAT = '%(filename)s %(funcName)s [line:%(lineno)d] %(message)s'
file_name = '{}Error/{}.txt'.format(project_root, today)
logging.basicConfig(filename=file_name, filemode='a', level=logging.DEBUG, format=LOG_FORMAT)
logger = logging.getLogger(name)
jieba
中文分词,中国人独有的烦恼。用jieba,分词一步到位!
import jieba.posseg as pseg
words = pseg.cut(text)
for item in words:
print(item.word)
pdfplumber
OMG!怎么会有这么好用的pdf解析包?用它!
import pdfplumber
pdf = fe.open(file_name)
for page in pdf.pages:
text = page.extract_text()
中文也好用!真是太强大了!
shutil
os包没有copy函数?那就只好用这个了!
from shutil import copyfile
copyfile(src, dst)
yaml
什么json什么xml,那是给非程序员看的玩意吗?要既能保存数据又具备良好的可读性,yaml,你值得拥有。更厉害的是,json是yaml的子集,所以读取json也可以直接用yaml实现。当然了,写json的话还是json方便一点。
pip install pyyaml
import yaml
yaml.dump(dictionary, allow_unicode=True)
dictionary = yaml.load(text, Loader=yaml.FullLoader)