2021年山东大学软件学院暑期实训——骨刻文字数字化识别开发与学习笔记1

最新推荐文章于 2024-09-09 09:47:53 发布

郁帆

最新推荐文章于 2024-09-09 09:47:53 发布

阅读量218

点赞数

文章标签：数据库大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43737006/article/details/118344487

版权

目录

项目背景
项目介绍
- 骨文字自动识别系统
个人工作

项目背景

中国文字自骨刻文起，甲骨文、金文……楷书，一脉相承，是研究人类思想文化发展的唯一的一份历史最长、发展序列最完善的文字。在海量的储存年代久远的兽骨中，识别出微小的文字是一项有意义的工作，项目工作将首先对兽骨上自然腐蚀，虫蛀及人为刻画进行分类，通过人工频道的方法代替繁重的人力劳动。更进一步将文字进行归类，依据其笔画的走向和纹理，尝试识别出兽骨上所记载的不同的文字个数。最后尝试通过甲骨文，小篆，鼎铭文等已知的汉字推断出古文字的具体含义。

项目介绍

骨文字自动识别系统

基于桌面系统的骨文字识别记录系统

“骨文字”是刻录在兽骨的人工刻画痕迹，然而在上千年的存留过程中，有很多的兽骨存在环境腐蚀，虫蛀蛇咬痕迹，设计一套整体方案，实现兽骨痕迹快速录入，并区分刻画痕迹和其他痕迹。

后台图像处理模块

前台收集影像数据后，进行初步的分类，提取出文字进行后台处理，通过机器学习方法和图像处理将前台图片进行文字提取，标准化，同一化，确保像素一致性。

文字识别归类

骨文字识别的重要目标是对骨文字的含义的解析，目前针对这些发掘的骨文字中，仅推断出9个子，对于骨文字的包含的不同文字的个数仍没有一个可靠的方法进行归类。本工作拟通过人文、考古、语言学与人工智能结合，提取特征，基本实现骨文字归类。

建立甲骨文和小篆比对库和数据集

建立甲骨文和小篆对应汉字的数据，并提取甲骨文和小篆对应的结构特征，以供骨刻文字的比对。

后期探索类工作

骨文字归类后，通过对比甲骨文和小篆等文字集合，推断骨文字含义，证明这段文明的存在，并尝试了解当时记录的社会结构。

个人工作

工作分析

本人当前分到的工作为甲骨文、小篆的简体字比对数据库建设和导入，完成该部分工作后会进行另外的工作。该数据库的建设是在为了跟识别后的骨刻文字进行匹配，因此该数据库的数据量是比较重要的。这导致个人工作的一大难点在于：“如何搜集甲骨文—简体字以及小篆—简体字的完整对照数据”。另一个需要考虑的地方在于在什么地方布置数据库。

工作思路分析

由于当前的任务在于构建数据库，因此最直接的思路就是构建三列的数据库，主键为甲骨文\小篆图片的编号、其余两列为对应图片的路径和对应汉字名称。后续特征数据库目前先不考虑。
总结出来的思路有两个：

思路一

①搜集简体常用字;
②对每个常用字﹐再根据甲骨文和小篆查询网站，查找该常用字对应的字体﹔
③把对应的字体图像保存为jpg或者png格式,保存入库。

思路二

①收集现有的甲骨文汉字对照表、小篆汉字对照表；
②在对照表中提取甲骨文\小篆图像数据、对应中文；
③把对应的字体图像保存为jpg或者png格式,保存入库。

具体使用那个思路要根据数据收集的情况而定。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2021年山东大学软件学院暑期实训——骨刻文字数字化识别开发与学习笔记1

目录项目背景项目介绍骨文字自动识别系统基于桌面系统的骨文字识别记录系统后台图像处理模块文字识别归类建立甲骨文和小篆比对库和数据集后期探索类工作个人工作工作分析工作思路分析思路一思路二项目背景中国文字自骨刻文起，甲骨文、金文……楷书，一脉相承，是研究人类思想文化发展的唯一的一份历史最长、发展序列最完善的文字。在海量的储存年代久远的兽骨中，识别出微小的文字是一项有意义的工作，项目工作将首先对兽骨上自然腐蚀，虫蛀及人为刻画进行分类，通过人工频道的方法代替繁重的人力劳动。更进一步将文字进行归类，依据其笔画的走向
复制链接

扫一扫

郁帆 CSDN认证博客专家 CSDN认证企业博客

码龄6年

20: 原创

105万+: 周排名

24万+: 总排名

1万+: 访问

: 等级

219: 积分

12: 粉丝

14: 获赞

6: 评论

23: 收藏

私信

关注

热门文章

最新评论

2021年山东大学软件学院暑期实训——骨刻文字数字化识别开发与学习笔记2
清风er: 大佬有没有做这个的文字识别模型
关于结构体里面有指针的一些梳理
CSDN-Ada助手: 恭喜您撰写了第18篇博客！标题为“关于结构体里面有指针的一些梳理”，看起来很有深度和实用性。对于结构体中包含指针的概念，您的博客给出了一些梳理，这无疑会帮助读者更好地理解和应用这一概念。我非常欣赏您的努力和持续创作的热情。对于下一步的创作建议，我想提醒您在博客中对于实际应用场景的讨论深入一些，例如结构体中指针的内存管理和常见错误的解决方法等。此外，您也可以考虑通过示例代码或图表来更加生动地呈现相关概念，这将让读者更容易理解和跟随您的思路。但请注意，这只是一个谦虚的建议，您已经做得很出色了。期待您未来更多精彩的博客！
【解决vscode连ssh问题：kex_exchange_identification: read: Connection reset】ssh无法重启
CSDN-Ada助手: 恭喜您写了第17篇博客！标题看起来很有意思，我很期待阅读您的解决方案。对于vscode连ssh问题，我也曾经遇到过类似的困扰，所以我对您的博客感到非常期待。希望您能够详细介绍如何解决这个问题，特别是对于"kex_exchange_identification: read: Connection reset"这个错误的处理方法。另外，如果可能的话，我建议您在博客中提供一些实际案例或者示例代码，这将帮助读者更好地理解和应用您的解决方案。再次恭喜您的创作，期待您的下一篇博客！
2021年山东大学软件学院暑期实训——骨刻文字数字化识别开发与学习笔记2
大家一起学编程（python）: 技术大佬真的是可以为所欲为，所以现在你可以对我为所欲为了。
2021年山东大学软件学院暑期实训——骨刻文字数字化识别开发与学习笔记2
彼方: 好文，大赞

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。