在列出实际思路之前,先上实例测试地址:https://www.jsanai.com/emaillist.html
基本实现思路:
1、写好网络爬虫模块(可参考githup项目:),建立网页外链url采集函数。
2、根据html内容分析提取页面email及手机信息函数。
3、建立可管理化数据库,对采集信息进行保存管理。
4、编写数据读取、对外接口服务模块。
基本流程代码分享(golang):
//主函数
func main() {
database.InitDB() //连接数据库
//验证真伪
go startHostEmailVerifyTask()
//发送邮箱到远程
go startHostEmailSendTask()
//启动邮箱采集
for {
startHostEmailTask()
time.Sleep(1 * time.Second)
}
}
//邮箱采集入口
func startHostEmailTask() {}
//邮箱地址有效性验证
func startHostEmailVerifyTask(){}
//邮箱地址分发保存
func startHostEmailSendTask(){}
完整应用代码由于公司原因,个人未能提供,争取业余时间重新写然后公布出来。