python游戏可以买什么书_游戏通关,电影看完,是时候用Python整理下电子书了

游戏通关,电影看完,是时候用Python整理下电子书了

2020-02-06 17:25:19

4点赞

34收藏

4评论

象小编这样喜欢收集电子书的人应该不在少数吧,存了好几个G的电子书,却从来想不起去看。每次看到新出的书又忍不住下载,下载完就感觉好象已经看完了!

于是电子书越来越多,都不知道是什么书了。其实象epub这种文件本身就包含了书名和作者信息。用任何压缩软件都可以解压打开,会找到一个content.opf文件,里面的dc:title标签里就是书名,dc:creator通常是作者名

...

桐华

...

最美的时光

...

当然我们不会傻到每个epub文件都去解压去查信息。用Python不用解压就直接读取epub文件,然后取出信息就好了。class EpubFile:

title = ""

creator = ""

content = ""

def __init__(self, file):

self.file = file

if zipfile.is_zipfile(file):

book = zipfile.ZipFile(file)

for f in book.filelist:

if '.opf' in f.filename: #有些epub不一定拥有content.opf, 可能叫package.opf

self.extract_meta()

opf文件是一个标准的xml, 我们用lxml加xpath就可以读出需要的信息。因为dc:title 需要namespace, 直接用上面例子里的

xmlns:dc="http://purl.org/dc/elements/1.1/"

方法如下def extract_meta(self):

if self.content != "":

title = self.content.xpath('//dc:title', namespaces={'dc': "http://purl.org/dc/elements/1.1/"})

creator = self.content.xpath('//dc:creator', namespaces={'dc': "http://purl.org/dc/elements/1.1/"})

if len(title) > 0:

self.title = title[0].text

if len(creator) > 0:

self.creator = creator[0].text

拿到作者名和书名后就可以为所欲为了, 小编的作法是作者名为目录,用书名作文件名。这样的好处是如果有的书是一章一个文件的就可以存在同一目录了。def rename(self, move_to_author_folder=False, top_folder=None):

if len(self.title) > 0:

print(f"{self.title}-{self.creator}")

try:

new_file = self.title.translate({ord(x): '' for x in '/:*?"<>|'})

folder = os.path.dirname(self.file)

if move_to_author_folder:

new_folder = self.creator.translate({ord(x): '' for x in '/:*?"<>|'})

if top_folder:

new_folder = os.path.join(top_folder, new_folder)

else:

new_folder = os.path.join(folder, new_folder)

if not os.path.exists(new_folder):

os.mkdir(new_folder)

shutil.move(self.file, os.path.join(new_folder, new_file + ".epub"))

else:

shutil.move(self.file, os.path.join(folder, new_file + ".epub"))

except Exception as e:

print(e)

else:

print(f"============== {self.file} do not have metadata ==========")

注意IO操作都是很容易出错的,用try..except是比较安全,而且不会影响后续操作。

书名中可能包含不适合做文件名的非法字符,比如‘/:*?"<>|’, 这个用translate方法可以删除。

top_folder是用来递归的,象三层以上的文件夹,如果再加作者名做目录,嵌套就比较多了,容易出现重复文件,所以都移到顶层目录为好。

递归操作如下,非科班出身的同学注意下,就是函数调用本身, 只不过参数换成下一级目录了def process_dir(folder, top_folder):

for file in os.listdir(folder):

file_path = os.path.join(folder, file)

if os.path.isdir(file_path):

process_dir(file_path, top_folder)

else:

if file.endswith(".epub"):

print(f"parsing {file}")

book = EpubFile(file_path)

book.rename(move_to_author_folder=True, top_folder=top_folder)

处理完了,文件夹非常清爽,可以安心去看电影书了

参考书目:

未经授权,不得转载

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值