开源
文章平均质量分 83
Liekkas Kono
开源组织RapidAI主理人。RapidOCR核心开发者
展开
-
发布中文文档类资源仓库-ChineseDocumentPDF
因此,我就考虑能否收集一些在线可获取的中文文档,并对它们做标注,算是促进中文文档智能的发展吧!而当前现状是中文文档场景数据集较少,不像英文文档有arXiv网站,国内中文论文并没有一个类似arXiv的聚集地,中文论文都是散落在各个期刊自建网站上。该资源可以与360发布的版面分析模型相结合使用,具体来说,用他们的模型给新的PDF图像打标注 → 人工校验 → 再次训练模型,迭代更多数据,模型就会越来越准。通过版式分析模型,我们就可以提前知道给定文档中,哪里是表格、哪些是图表,哪些是公式,哪些是文本段落等。原创 2024-06-13 22:16:27 · 423 阅读 · 0 评论 -
Github Discussions使用指南(建议收藏)
无论您是在规划功能路线图、询问有关您正在做的事情的问题,还是与构建您所使用的软件的开源社区互动,GitHub Discussions 都为所有社区(开源和私人)提供了一个连接和协作的中心空间。为对话和提问提供一个集中的社区空间(并使维护人员在处理问题和拉取请求时的生活更轻松)为新手和非代码协作者创建一个参与更大社区的地方突出项目贡献者以帮助培养下一代维护者现在就尝试在您的公共或私有资源库中启用它,或者与您有兴趣了解的任何开放源代码社区进行互动。翻译 2024-06-06 22:44:17 · 62 阅读 · 0 评论