背景:最近一段在忙着和单位招聘相关的技术环节的事宜,前几天有个活,是把单位邮箱中的简历下载打印下来。这事看起来简单极了,事实上也很简单,但是上手一做,忙活了大半个中午,才下载打印了不到40份简历。
究其原因,
第一,邮箱没有提供批量下载附件的功能(有批量下载部分附件功能,但是一是那样文件就散乱了,而是仍然需要点击多次),只能打开一份邮件,进去找到附件,然后点击下载附件,而且浏览器下载附件的速度也是抽疯的,忽快忽慢。
第二,应聘者可能比较匆忙,没好好阅读招聘公告,造成递交的材料没有按照规范打包成压缩文件,下载起来又增添较大工作量
解决方案:从理论讲,重复性的劳动都可以用计算机来解决。从现实讲,日后还会有大批的简历要下载打印,截至写本文时,已经有133份,以后会更多,要是一份一份下,需大量时间,更重要的是,时间长就易出错,易遗漏。从个人讲,快速写个小程序也是锻炼热身一下。
方案一:爬虫。因为下载过程是,登陆邮箱,点击邮件,再点击附件下载,和爬虫思路相近。笔者之前写过很多爬虫博客,这里就不赘述了,思路都是一样的,具体问题具体分析就行。不过这次我没选爬虫,因为相比方案二,有些麻烦。
方案二:使用python的poplib包和Email包直接下。不废话了,直接上源码
import poplib
from email.parser import Par