01
多语言漫画翻译开源项目
Comic Translate,由开发者 ogkalu2 精心打造的开源漫画翻译应用,这不仅仅是个应用,它是你跨语言的数字伙伴,帮你翻译世界各地的漫画。
无论是英语、韩语、日语、法语、简体中文、繁体中文、俄语、德语、荷兰语、西班牙语还是意大利语,Comic Translate 都能完美适配,让你的漫画随时随地触手可及。
Comic Translate 的核心是利用 GPT-4 的能力,实现自动化翻译流程。它结合了 OpenCV 和 PIL 这两个强大的图像处理库,能够精准识别并提取出漫画中的文字。之后,通过调用 Google Translate API 或自定义的翻译服务进行翻译。
开源地址:https://github.com/ogkalu2/comic-translate
①多语言支持:英语、韩语、日语、法语、简体中文、繁体中文、俄语、德语、荷兰语、西班牙语、意大利语,一个不落,Comic Translate 让你的漫画阅读无国界。
②图像处理:Comic Translate 结合了 OpenCV 和 PIL 这两个强大的图像处理库,能够精准识别并提取出漫画中的文字。
③自动化翻译:Comic Translate 利用 GPT-4 的能力,通过调用 Google Translate API 或自定义的翻译服务进行翻译,实现自动化翻译流程。
Comic Translate,你的开源漫画翻译神器,等你来发现更多可能!
02
GPTPDF:使用GPT解析PDF的开源项目
让我们一起来了解一下 GPTPDF,这是一个由 CosmosShadow 开发的开源项目,已经在 GitHub 上获得了超过 1.8k 颗星星。这个项目使用类似 GPT-4o 的视觉大语言模型(VLLM)将复杂的 PDF 解析为 Markdown。
输入的 PDF
转化成的 Markdown
输入的 PDF
转化成 Markdown
GPTPDF 的核心理念是简洁和高效。它的核心代码仅有 293 行,但却能够几乎完美地解析排版、数学公式、表格、图片、图表等。
每页的平均成本仅为 0.013 美元,这包括了 GPT-4o 接口的费用。
GPTPDF 使用 GeneralAgent 库与 OpenAI API 进行交互。此外,GPTPDF 还提供了一个基于 GPTPDF 的可视化工具,名为 pdfgpt-ui。
① 解析 PDF:使用类似 GPT-4o 的多模态模型解析 PDF 文件,转换为 Markdown 格式。
② 代码简洁高效、成本低廉:仅 293 行的代码,简洁而高效。每页仅需 1 美分,性价比极高。
③ 解析结果全面:几乎完美地包括排版、数学公式、表格、图片、图表等内容。
开源地址:https://github.com/CosmosShadow/gptpdf
GPTPDF,你的 PDF 解析好帮手,等你来发现更多可能!
扫描关注 逛逛GitHub