简历解析的疑问?

今天投简历的时候,发现某平台解析出来的线上简历内容缺失了几部分。不怕解析错误多,就怕解析错误少到难以察觉,解析之后人为检查不出来。改完之后我就在想,为啥会出错,简历解析的痛点在哪里呢?都2024年了,人们都在讨论AI如何取代人类的年代了,为什么简历这种内容量并不多的文件,解析还会出错呢?

反正每一次更新简历,各个平台轮番手动修改,调整样式。如果是大的信息变动,想想都头疼。对于个别招聘岗位,需要临时调整简历内容,由于是PDF格式,又得去对应招聘网站内修改再导出。苦秦久矣难道只有我是这样的吗?

解析的痛点

  • 文件格式多样,如word、pdf、html、图片、文本等。由于不是结构化的数据,增加了解析难度
  • 字体、样式、文件编码都可能导致解析错误

这是我能想到的一些点。我做过PDF解析,对于固定模版的PDF文件,解析几乎不会出错。但是对于内容多样的PDF,解析确实有难度,除了解析内容,还需要将内容通过关键字进行挑选和映射,这些都会增加解析的难度。单一格式的PDF尚且如此,如果是支持上传多种格式,对开发人员来说也是考验。

结构化数据

既然知道非结构化的数据解析困难,为什么在附件下载或导出时不提供结构化导出呢?

  • 是因为没有可参考的行业数据规范吗?定义一个呗,这不正是企业扬名的机会么,可以制定所在领域的行业规范。
  • 或者说是因为各大招聘平台各自为营,制定的规范或导出的数据互相不认可
  • 又或者是考虑到PDF和word格式的普遍性,新的文件类型需要特定软件打开。

提升用户体验的事还得用户自己做,想一下该如何以最新变动来改善这种情况。
有没有该领域的同行出来现身说法聊一聊,取取经

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值