2021SC@SDUSC-SDUDOC-blog00

本文概述了SDUDOC项目团队的分工,包括逻辑引擎、图像渲染、后端架构、数据库及数据分析。项目目标是通过输入简体字匹配古籍并提供原文,强调了古籍保护与数字化的挑战。已完成的功能包括上传处理和检索古文字。待实现的特色如繁简切换、生僻字造字系统和多格式展示等。
摘要由CSDN通过智能技术生成

2021SC@SDUSC

(突然发现自己等级可以自定义标签结果带特殊字符的标签打不上Orz)

在这里插入图片描述

组内分工

小组选题为SDUDOC,与导师、学长交流后,通过组内协商,分工如下:戈同学负责逻辑引擎实现与基础UI绘制、刘同学负责图像渲染引擎与文档格式 杜同学负责后端服务器分布式架构、张同学负责后端数据库和数据分析。

前期调研与整体分析
项目背景

​ 中华上下泱泱五千年,先辈的智慧存于书中传承至今。然而,存放数百年乃至数千年的古籍十分脆弱,经不起翻阅等直接接触,需要极其苛刻的环境存放与保护。专业研究者、普通爱好者们使用需求量与古籍的保护要求形成了极为尖锐的矛盾。

​ 正如几千年前筹代替绳结、纸代替竹简,将繁重的资料数字化已然成为时代的潮流。古籍领域亦是如此。对古籍的整理、保护和利用,就是最大限度地保护与传承中华文脉和传统文化。但是目前,如国家图书馆http://www.nlc.gov.cn/‎、中国哲学书电子化计划https://ctext.org/zhs、阿里达摩院汉典重光等项目所做的基本只基于查询需求,不提供书籍影印原貌、或是不提供繁简转换、或者不能把搜索的内容定位到相关古籍页面。

​ SDUDOC项目目标是户输入简体汉字就可以自动匹配到相关古籍,并可以查找到相关的古籍原文,看到古籍的原貌。同时通过图像识别自主区分注释与正文内容、实现基于语义的内容整理。

目前已完成功能
  1. 上传扫描古籍,并对古籍段落进行框选,生成SVG文档并通过上传模块发送到后端
  2. 输入古文字对应的现代汉语字形字意和相关字词标注
  3. 将编辑器中编辑和修改的古文字及其相关资料上传至服务器的工作
  4. 查阅模块完成输入现代汉字字音字形检索相关古文字和古文的工作
待完成需求(预计会随代码分析与项目的理解深入不定时增加)
  1. 繁简体输入法切换

  2. 针对生僻字的造字系统

  3. 制定规范,实现XMLtoHTML,XMLtoPDF、XMLtoFLASH、XMLtoHTML5等,能够多种形式进行文档展示

  4. 古籍(竖排)和现代文(横排)的兼容展示与处理,细化用户体验

  5. 需要一定的古文标注数据实现AI语义裁切并增加其准确度

项目整体架构

在这里插入图片描述

安装过程

常规项目导入。
存在问题:git clone时遇到ssl reset和timed out.

在这里插入图片描述

但是可以ping通GitHub,故怀疑网络问题。

在这里插入图片描述
解决:睡觉。第二天起床clone。成功。
在这里插入图片描述
(指路Git遇到问题解决合集by ChiZ:
https://chizz.blog.csdn.net/article/details/114941246

所用maven版本:
在这里插入图片描述
IDEA引入maven路径:
在这里插入图片描述
导入依赖即可。具体代码架构与分析下一篇咯。
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Chi Z犬里

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值