2021SC@SDUSC
创新实训项目分析——综述
项目分析
项目背景
正如几千年前筹代替绳结、纸代替竹简,将繁重的资料数字化已然成为时代的潮流。古籍领域亦是如此。对古籍的整理、保护和利用,就是最大限度地保护与传承中华文脉和传统文化。但是目前,如国家图书馆http://www.nlc.gov.cn/、中国哲学书电子化计划https://ctext.org/zhs、 阿里达摩院汉典重光等项目所做的基本只基于查询需求,不提供书籍影印原貌、或是不提供繁简转换、或者不能把搜索的内容定位到相关古籍页面。
SDUDOC项目目标是户输入简体汉字就可以自动匹配到相关古籍,并可以查找到相关的古籍原文,看到古籍的原貌。同时通过图像识别自主区分注释与正文内容、实现基于语义的内容整理。
功能分析
目前已完成功能
- 上传扫描古籍,并对古籍段落进行框选,生成SVG文档并通过上传模块发送到后端
- 输入古文字对应的现代汉语字形字意和相关字词标注
- 将编辑器中编辑和修改的古文字及其相关资料.上传至服务器的工作
- 查阅模块完成输入现代汉字字音字形检索相关古文字和古文的工作
待完成需求(预计会随代码分析与项目的理解深入不定时增加)
- 繁简体输入法切换
- 针对生僻字的造字系统
- 制定规范,实现XMLtoHTML,XMLtoPDF、XMLtoFLASH、 XMLtoHTML5等, 能够多种形式进行文档展示
- 古籍(竖排)和现代文(横排)的兼容展示与处理,细化用户体验
- 需要一定的古文标注数据实现Al语义裁切并增加其准确度
技术栈
1、前端框架vue
应用广泛的前端框架,实现数据的动态绑定,有良好的性能
2、2D渲染库- PIXI
速度很快的2D库,用来渲染绘制基本的图形
3、vuetify
一个material风格的vue样式库,减少了很多css设计并使风格统一
4、面向对象的原生js
也是该项目最大的特点。不同于传统的前端界面将逻辑写在vue文件中,该项目使用了js面向对象的思想,将大部分逻辑以对象的形式从页面中抽离,以一个引擎来统一管理所有的逻辑功能。这样的好处是使得项目的扩展性很好,易于功能的增加与修改。但同时也使得代码架构相对复杂,比较考验对js基础与面向对象设计逻辑的掌握。
项目架构
环境配置
node.js
Ubuntu:
sudo apt install node
MacOS:
brew install node
brew install npm
Windows:
官网下载安装包安装即可
项目分工
与导师、学长交流后,通过组内协商,分工如下:戈同学负责逻辑引擎实现与基础UI绘制、刘同学负责图像渲染引擎与文档格式 杜同学负责后端服务器分布式架构、张同学负责后端数据库和数据分析。