计算机视觉专硕:OCR、实习和秋招


向AI转型的程序员都关注了这个号????????????

机器学习AI算法工程   公众号:datayx

智能票据录入系统 项目展示

真的是光阴似箭,好像昨天还沉浸在考研成功的喜悦,今天却要即将步入2019年,即将硕士毕业。老规矩,还是在每一年的最后一天总结今年以及展望明年。回首2018,经历的东西特别多,视野也开阔了不少,可以说,2018是丰收的一年。如果用三个关键词来描述我的2018,那无疑是:OCR、实习和秋招。

2018是研究生成长极快的一年,年初把研一上学期一直专注的研究整理成两个发明专利并成功公开,算是很早就达到了学院的毕业要求,所以在接下来的研究生生涯里可以花更多的时间放在自己感兴趣的领域深入探索,以及可以有充足的时间尝试新的想法。在研究生初期一直在专研传统计算机视觉的东西,无论是图像拼接还是图像特征点,都是偏向于传统方法。研究生中期逐渐转向了深度学习,尤其一直专注于OCR领域,并在这个领域探索了不少时间,从文本检测到文字识别,再到端到端的文本识别,再到近期研究的特定领域的文字识别。OCR构成了我2018研究生生涯的关键词,基本的精力都放在这里了,这期间也在博客园写了不少关于OCR的文章,貌似反响也不错。现在比较大的想法是,OCR近年来的进展非常迅猛,是在一些特定场景落地的好时期,刚好自己也在文字识别这个方向有所积累,所以也想把OCR技术应用到一些生活场景中,解决生活中的一些难题。12月也是我毕业论文开题的时间点,我也毫不犹豫地选择了OCR算法研究作为我的毕业论文方向,我觉得,我的研究生生涯如果以OCR算法研究来作为我的研究生标签的话那真是十分贴切了。

2018年是忙碌的一年,因为专硕时间非常紧,基本需要一年内完成研究成果的发布、实习和秋招找工作,另一年一般用于基本的上课修学分以及毕业论文和答辩。所以2018年就是一个忙碌的年份,因为这一年我除了要尽早给出研究成果外,还需要完成实习和秋招两件大事。今年实习招聘很早,我大概二月底就开始找暑假实习了,因为一开始没什么经验,面试什么的基本都翻车,后面掌握套路了,面试起来越来有信心,基础知识也越面越牢固,接下来接陆续收到一些offer,后面刚好也收获了Intel中国研究中心的实习offer,跟经理讨论了实习的内容,感觉非常有趣,后面就直接接受了。

后面5月到9月一直在北京英特尔实习,实习期间过得非常愉快,与一群厉害的研究员和工程师工作,真是受益匪浅。因为实习期间也刚好是秋招提前批开始的时间点,所以我也在7月底开始着手准备秋招提前批的知识储备。一边实习一边找工作真是压力很大,还有的时候实验室导师也找我做点研究,所以那段时真的是黑暗岁月,真的非常累。想起8月份那段时间经常实习时写写代码被打电话过来面试,然后匆匆忙忙去电梯间接电话面试,还是相当窘迫,不过没办法,大家都是这么过来的哈哈。秋招找工作相对于春招找实习真的是简单太多了,第一是因为有了春招实习面试的经验,秋招面试完全不虚,有套路可循,而且8月时自己的知识储备更加充分了,自信满满;第二是有了Intel的实习经历,在跟面试官介绍时也有了十足的话题。所以我在在8月各大公司的提前批招聘时基本都收获了不少不错offer,后面正式秋招都基本没参与了,所以所谓的金九银十我也没太多想法。

在这个秋招阶段一共收获了8个offer:在8月提前批大潮时已经收获了腾讯、快手、360、VIVO和平安的offer,9月结束Intel的实习回到学校继续学业,然后整个月基本处于划水阶段,然后只收获了AI独角兽地平线的算法岗offer(这种小而精的公司面试真难,五轮狂轰乱炸)。10月某个早上我在Intel的经理打电话给我高兴地通知我他为我申请到了return offer,真是振奋人心的消息!10月底,刚好看到宝洁IT管培生的招聘,这里想说说这段有趣的经历。本来是不考虑非互联网企业,后面因为有个朋友一直很想去宝洁当管培生,而且我了解宝洁这家公司后,也被这家公司圈粉了,福利和管培生培养制度都属于业界翘楚。后面我也觉得要不试试世界500强的管培生,锻炼锻炼技术之外的技能?我的英语口语很渣,但我竟敢紧张练习英语口语几天,就去宝洁广州总部面试了。这种世界顶级传统企业在招聘上并不会太关注你的技术有多强,更多关注的是你的领导能力和综合素质,考察的方面非常多,第一轮直属经理对你面试,对英语口语对你项目领导能力进行考察,看重你解决问题能力;第二轮是宝洁三个不同部门的总监对你轮番发问,全程高压问答一小时,专业技术知识考察和项目解决能力的考察依然是重点,当然英语问答还是少不了的,英语问答还是用我的蹩脚广东英语回答了一下,场面一度非常尴尬。但是后面还是收获了宝洁的IT管培生offer,也算是对我的一个综合能力的一个肯定吧!

回想2018,真的经历了很多事情,忙碌却非常充实,感觉一年时间很短,但成长又很多。3月跟随自动驾驶团队到了常熟进行了15天的上线前的研发调试,通宵达旦最后把自动驾驶最新版本成功上线,新闻发布会演示非常顺利;4月找实习,经历各种失败各种心态崩溃又不断自我调节,最后选择入职英特尔;5至9月在北京开启实习生生活,在公司里遇到一群非常优秀的同事,见到规范化的项目开发流程,学习到了书本学不到的各种技术;在生活里也认识一群好玩优秀的小伙伴,让我在北京的生活丰富多彩;8到10月秋招旅程,虽然刚开始很苦,但一路都比较顺利,最后也得到了理想公司的赏识;11到12月开始帮助导师负责新的项目,又是一个新的挑战,同时毕业论文正式开题,硕士毕业答辩似乎在向我招手了。

特意找来上一年写的2017总结里面定的2018计划,看看实现了多少:

2018的展望:
1.找个好工作,发个好paper,就是2018最大的愿望。// 工作找好了,paper放在2019发,2018发了专利,获得了毕业条件
2.博客坚持写,不断总结不断提高。// 这个还在坚持
3.在github上认真搞一个好project,拿些星星。// 大突破,贡献了几个好项目
4.把现在的项目做好,顺利上线。// 基本完成吧
5.坚持读经典课外书,坚持体育锻炼,综合素质比什么都重要。//看书和锻炼都有在坚持
6.好好搞个大比赛,上次没拿到奖,这次争取拿到!//2018没有参加比赛了,感觉比赛对我的吸引力不是太强,太忙了

说一说2018最富有成就感的事情吧

  1. 去了Intel实习

  2. 在北京结识到一群优秀有趣的朋友

  3. 找到了理想的工作

  4. 博客一直坚持更新,虽然更新频率不高,但是还是会坚持的,现在技术博客的粉丝突破了800,阅读量也超过50W了

  5. 今年在GitHub开源了几个好玩的项目,逐渐有了一百多个follwers,星星也攒了好几百

  6. 收获两项发明专利

2018总结完了,是时候给新的一年做做计划了!

  1. 整理手头上的研究成果,投顶会paper

  2. 顺利过论文审核,顺利过论文答辩,顺利7月毕业!!!2019的终极目标。

  3. 钻研一下分布式系统,分布式计算,推荐系统的知识

  4. 会在毕业论文写好以后开源两个有趣的项目:多图自动拼接算法和票据识别系统

  5. 走南闯北,能顺利毕业的话,真想去台湾走一走!

上传几张2018有趣的照片

我在Github上2018一年的活动,我是一个纯粹的程序员:

我参加了阿里极客训练营,见到了大佬云风

常熟拼命上线后,去了苏州逛了逛,夜色迷人

某天实习下班,发现天都黑了,远远望去公司大楼,非常漂亮:

北京实习时的小窝,逸成东苑,难忘的地方:

智能票据识别系统

CPS-OCR-Engine

一个基于深度学习的文字识别系统,支持3755个(一级字库)的印刷体汉字识别。

因为在帮学校财务处审计处设计智能票据识别系统(已经支持数十类票据啦),需要用到OCR去识别一些汉字,做智能信息录入。对于汉字的识别,我尝试过Tessercact,实在太烂, 也试过百度的ocr接口,但是感觉不太适合(第一是要钱的,第二毕竟是别人的API,想优化也优化不了),那就自己搞一搞基于深度学习的OCR引擎吧,算是锻炼一下自己。

本文相关代码 获取

关注微信公众号 datayx  然后回复  OCR  即可获取。

AI项目体验地址 https://loveai.tech

端到端不定长文本识别CRNN代码实现

对于端到端不定长的文字识别,CRNN是最为经典的识别算法,而且实战看来效果非常不错。上面识别结果可以看出,虽然我们用于训练的数据集是自己生成的,但是我们该模型对于pdf文档、扫描图像等都有很不错的识别结果,如果需要继续提升对特定领域的文本图像的识别,直接大量加入该类图像用于训练即可。

原文地址 https://www.cnblogs.com/skyfsm/p/10345305.html


阅读过本文的人还看了以下文章:

【全套视频课】最全的目标检测算法系列讲解,通俗易懂!

《美团机器学习实践》_美团算法团队.pdf

《深度学习入门:基于Python的理论与实现》高清中文PDF+源码

python就业班学习视频,从入门到实战项目

2019最新《PyTorch自然语言处理》英、中文版PDF+源码

《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码

《深度学习之pytorch》pdf+附书源码

PyTorch深度学习快速实战入门《pytorch-handbook》

【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》

《Python数据分析与挖掘实战》PDF+完整源码

汽车行业完整知识图谱项目实战视频(全23课)

李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材

笔记、代码清晰易懂!李航《统计学习方法》最新资源全套!

《神经网络与深度学习》最新2018版中英PDF+源码

将机器学习模型部署为REST API

FashionAI服装属性标签图像识别Top1-5方案分享

重要开源!CNN-RNN-CTC 实现手写汉字识别

yolo3 检测出图像中的不规则汉字

同样是机器学习算法工程师,你的面试为什么过不了?

前海征信大数据算法:风险概率预测

【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类

VGG16迁移学习,实现医学图像识别分类工程项目

特征工程(一)

特征工程(二) :文本数据的展开、过滤和分块

特征工程(三):特征缩放,从词袋到 TF-IDF

特征工程(四): 类别特征

特征工程(五): PCA 降维

特征工程(六): 非线性特征提取和模型堆叠

特征工程(七):图像特征提取和深度学习

如何利用全新的决策树集成级联结构gcForest做特征工程并打分?

Machine Learning Yearning 中文翻译稿

蚂蚁金服2018秋招-算法工程师(共四面)通过

全球AI挑战-场景分类的比赛源码(多模型融合)

斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)

python+flask搭建CNN在线识别手写中文网站

中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程

不断更新资源

深度学习、机器学习、数据分析、python

 搜索公众号添加: datayx  

发布了31 篇原创文章 · 获赞 18 · 访问量 3万+
展开阅读全文

没有更多推荐了,返回首页

©️2019 CSDN 皮肤主题: 大白 设计师: CSDN官方博客

分享到微信朋友圈

×

扫一扫,手机浏览