中文简历解析工具(resume-parse tool)盘点
前言
本文主要参考文章 resume-parse-evaluation ,在此基础上,我结合目前最新的一些中文简历解析工具,进行盘点。
数据截至2023年8月10日。
简历是什么?
简历的类型
一般来讲,根据不同的候选者和公司所选择的招聘渠道的不同,我们会收到不同类型的简历:
1、各大招聘网站上的网页版简历
应聘者在各网站上按网站提供的固定模板填写信息,形成网页版或从网页下载的其它格式简历(统称网页版简历)。针对网页版简历的基础解析技术,各公司准确率不相上下,难度在于针对每一个固定模板做细致的分析,简历解析技术的准确度依赖于勤奋和经验。 智联、51、拉勾、猎聘。
2、应聘者按照自己的想法和偏好,制作的 word、pdf、png 甚至 excel 格式的简历
这类简历格式五花八门,由于不是直接以网页代码的模式呈现,且没有相对固定的模板和关键词字段,给系统识别带来了挑战。对于系统来讲,要寻找规律并判断识别就会有一定难度,此类简历解析无法做到百分百。
简历文件格式
doc, docx, xls, xlsx, mht, mhtml, html, htm, txt, pdf, rtf, eml, wps, xml, dotx, msg, jpeg, jpg, gif, png, bmp 等格式,基本上覆盖了招聘市场上99%的简历格式。
简历内容数据
中英文混合,大概有100余个字段,涵盖基本信息、联系方式、期望职位、教育经历、工作经历、 项目经历、技能、语言能力、证书、自我评价等字段信息。
https://github.com/hxu296/nlp-resume-parser 从简历中提取感兴趣的字段。
付费工具
公司名称 | 网站 | 网友评价 | 测试demo | 支持格式 | 价格 | 部署方式 | 其他 |
---|---|---|---|---|---|---|---|
捕鱼科技 | http://www.buyu-tech.com/ http://www.cv-parser.com/ | – | Y | 不支持图片 pdf、doc、docx、html、htm、txt、zip、mht、ppt等 | 付费 | SaaS和本地部署 | |
云解析 | http://youyun.com | 他家的demo效果很一般,稍微特殊一点的情况就处理不好; | Y | 21种简历格式 支持图片 | 付费 | SaaS | |
cv-extract 北京有本科技 | http://k18.com.cn | 这家做解析有一定的时间了,改头换面也包装了几家分店。总体效果还可以,但还存在不少的问题; | Y | 支持图片 | 付费 | SaaS和本地部署 | |
北京云湾科技有限公司 | http://resumesdk.com | 这家比较低调,感觉不太善于宣传,但总体效果是三家中最好的,特别是能很好解决不同网站模板包括自由格式的简历,而且上手很简单方便。 | Y | 支持图片 | 付费 | SaaS和本地部署 | |
德士达科技公司 | http://www.daxtra.cn/ | 简历解析Daxtra 做得相当不错,我听说他们香港有设点也在国内推广,听说是爱丁堡大学教授开发的算法。蛮多外国大公司和猎头用他们的。 | N | – | 付费 | – | |
杭州少世科技有限公司 | www.littleparser.com | 小析简历解析,免费试用现在,国际大数据团队研发的 | Y | 不支持图片 | 付费 | SaaS | – |
CV Tech 简历 | http://www.jianlijiexi.com/ | – | Y | 支持图片 | 付费 | SaaS和本地部署 | — |
大易 | https://www.dayee.com/ | – | N | 不支持图片 | 付费 | – | – |
麦穗简历洞察 | https://www.mesoor.com/resume-insight.html | – | N | 不支持图片 | 付费 | – | – |
开源工具
OpenResume
OpenResume 是一个功能强大的开源简历生成器和简历解析器。
OpenResume 的目标是为每个人提供免费的现代专业简历设计,让任何人都能充满信心地申请工作。
官方网站:https://open-resume.com
OpenResume 拥有两大核心组件:简历生成器(Resume Builder) 和 简历解析器 (Resume Parser)。
标星数:3.5k stars
编程语言:TypeScript
至今仍处于活跃状态
简历解析器功能预览:
xparser
xparser 是基于纯文本的简历解析桌面版,自带一键安装卸载程序,支持磁盘扫描,后台监控进程自动扫描,支持简历内容抽取,简历解析,解析后结构化存储,识别的文件格式有pdf,word,text,html等。
标星数:34 stars。
编程语言:c#。
上一次更新时间:6年前。
job
job是简历解析工具。支持猎聘、前程无忧、拉勾、智联网站上的简历。支持html、doc、pdf、eml。
标星数:35 stars。
编程语言:java。
上一次更新时间:7年前。
简历举例
从网络上收集一些公开获取的简历数据,不适之处请联系删除。