使用javax.mail对邮箱邮件进行爬虫
对于一些人力资源公司,每天会收到大量的求职者的邮件。人力资源公司,需要对这些邮件进行分类,并将求职者信息保存到自己的数据库中。如果手工分类,那就太麻烦了。所以可以使用一定的技术,对邮箱中的邮件进行爬虫。这里主要讲如何使用javax.mail进行邮件爬虫,并且邮箱以智联招聘的邮件为例 以下是具体步骤
一、将收邮件的邮箱开通imap服务
需要登录自己的邮箱进行开通
开通时,一定要记住自己的授权码,待会代码中会使用到,这时还需注意页面中会提示imap的服务器地址,这个地址也需要注意一下,待会编码中同样会用到。不同的邮箱,地址是不一样的。我这里使用的126的邮箱。
二、在开发工具中,新建maven项目,并在pom.xml文件中导入javax.mail依赖
三、接下来就是进行编码操作了
public class EmailParse {
private String imapServer = "imap.vip.163.com" ; //imap协议服务器地址
private String protocol = "imap"; //连接邮箱使用的协议
private String username = "xxxxxxxx@vip.163.com"; //连接邮箱的用户名
private String password = "xxxxxx";//连接邮箱的授权码
private static SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
public void beginParse() throws MessagingException, FileNotFoundException, IOException {
Properties props = new Properties();
props.setProperty("mail.store.protocol", protocol); //设置连接协议
props.setProperty("mail.imap.host", imapServer);//设置服务器
Map<