在平常的工作中,我们会经常需要从一些文本中获得一些想要的信息。这些文本可能是某个系统自动生成的,或者是很多人手写的发给你,让你去做个汇总。无论怎么来的,总之它就是个文本格式的文件,相对于excel或者csv格式的文件。处理起来就不会那么方便,可能还需要手动的去找想要的信息,把信息放到表格上。
我们先来看一个栗子,比如我们从一个可能不是那么人性化的系统里面获得了几个文本格式的简历信息。想要去做一个简历信息的汇总。
简历文件在下方:
简历信息.txt
4.1K ·
百度网盘
如果我们要对文本格式的信息进行汇总,就要转化为一种结构化的数据格式。而这里涉及到项目名和项目内容,所以这里选用字典来存储转化后的数据。转化成字典后写成表格形式就比较容易了,这个在文章最后会有介绍。我们先要思考怎么从一个文本文件得到一个字典。
首先我们想到的是使用循环的方式来实现,实现方式如下:
运行后的结果如下:
源码可以在下方获取:
CirculationMode.py
2.1K ·
百度网盘