背景介绍
最近参加了极客时间的《AI 大模型应用开发实战营》,和老师共同开发了一个实战项目:Translator,将英文的pdf文档翻译成中文,再以pdf格式输出。
老师先对市场需求做了分析,相对于传统翻译,成本很高,但通过大语言模型就可以大大地降低成本,总体来说,很有钱景。我收到这个作业是很兴奋的,因为这不是在实验室里的玩具,而是可以直接放到市场的一个服务一个工具。
需求分析
这是老师给出的需求列表
- 支持图形用户界面(GUI),提升易用性。
- 添加对保留源 PDF 的原始布局的支持。
- 服务化:以 API 形式提供翻译服务支持。
- 添加对其他语言的支持。
开发历程
一开始热情高涨,觉得自己能够完成所有需求,但实际做起来可一点都不简单。就单单把项目启动起来走完整个流程就花费了我一天时间,要知道我是做java开发的,python对于我来说有点陌生,好在老师和同学的支持下,再加上自己的耐心,我给自己拆解任务,降低要求,咱们不求完美只求完成,在自己的能力范围之内做自己能做的功能。
成果
添加分行符
老师version1.0解析出来的pdf的分段格式是丢失的,所有文字都挤在一块,我调整样式,恢复了分段。
if content