文件操作
中科小白
这个作者很懒,什么都没留下…
展开
-
分享一个用python实现将pdf转txt的代码
问题背景:有时候需要用到pdf文件中的信息,但是pdf不易编辑,格式有局限性,需要转成txt这样的格式。目标:将给定pdf文件中的文本信息(暂时不考虑表格、图片等)抽取出来,写入txt文件中。主要工具:python的pdfminer3k库(pdfminer的python3端口,pdfminer是一个用于从文档中提取信息的工具)代码:import importlibimport sysimport timefrom pdfminer.pdfparser import P原创 2020-05-30 16:16:34 · 5989 阅读 · 4 评论 -
python实现将多个文件内容合并到一个文件
问题场景:有时候需要将数十个甚至上百个txt或其他格式的文件内容合并到一起,如果一个个复制粘贴显然太费功夫,因此可以用代码实现文件内容的合并。代码示例:import osimport linecachedef combine_file(): # 读取指定路径下的所有文件并放入到列表中 root = input('please input the dir:')...原创 2020-03-16 15:51:39 · 13443 阅读 · 9 评论