目 录
汉字是上古时期世界上各大文字体系中唯一传承至今的表意文字,包含着丰富的文化内涵和审美意蕴,是我们民族祖先智慧的结晶,是中华文明最灿烂的瑰宝之一。近代考古发现了3350多年前殷商的甲骨文,是中国最早的文字。作为炎黄子孙,了解祖国的历史发展,传承文化的魅力和精髓,是每个华夏儿女应尽的义务,义不容辞的责任。但是甲骨文上承原始刻绘符号,下启青铜铭文,对于普通人的识别非常困难。所以如何有效的识别龟壳上的这些文字正是本项目的目的所在。
甲骨文是世界上最古老的文字之一,被认为是现代汉字的早期形式,有时候也被认为是汉字的书体之一,也是现存中国最古老的一种成熟文字。甲骨文又称契文、龟甲文或龟甲兽骨文。甲骨文是一种很重要的古汉字资料。它对保护历史文化遗产和探究文字的起源有着非常重要的意义。自1899年甲骨文在河南安阳被发现以来,目前发现有大约15万片甲骨,4500多个单字。这些甲骨文所记载的内容极为丰富,涉及到商代社会生活的诸多方面,不仅包括政治、军事、文化、社会习俗等内容,而且涉及天文、历法、医药等科学技术。从甲骨文已识别的约1500个单字来看,它已具备了“象形、会意、形声、指事、转注、假借”的造字方法,展现了中国文字的独特魅力,国内外学者对他表现出浓厚的兴趣。2016年中国文字博物馆发布《关于征集评选甲骨文释读优秀成果的奖励公告》,面向海内外公开征集甲骨文释读优秀成果,并对破译未释读甲骨文并经专家委员会鉴定通过的研究成果,给予单字奖励10万元;对存争议甲骨文做出新的释读并经专家委员会鉴定通过的研究成果,给予单字奖励5万元。由此可见,对于甲骨文识别的重视程度。
在当今,文字是人们传递信息的方式,特别是今天信息技术的飞速发展和移动互联网的快速普及,很多信息都能够通过互联网进行处理。现在,越来越多地人依靠键盘等输入工具书写,减少了手写汉字的机会,正确书写汉字的能力逐渐下降,很多年轻人连最常用的简体字都不会写,更不要说早期的草书、篆书、甲骨文等文字。
众所周知,中国的文字历史源远流长,文字发展经历了很多阶段,现在人们使用的文字是经过若干年进化之后得到的简体字,很多文献资料、历史精品部分,可是并没有多少人能够完全读懂这些文献,往往是对古代字体的不熟悉或者根本不认识。加之出于对文物的保护,基本上也不允许人们手捧龟甲兽骨进行甲骨文的研究,或者直接拿着文物去鉴别上面的文字。于是计算机辅助文字处理成为炙手可热的研究方向。但是目前为止尚未有一款手机或者计算机软件能够针对中国各种字体进行文字识别,尤其是将甲骨文准确的转化为现代简体字。所以是否有一款能够通过结合手机相机功能和识别功能的优点来处理对甲骨文的识别呢?我们的项目手机软件小甲识图就希望能够即时的把手机拍摄到的图片文字信息转换文本格式,并给出对应现代简体汉字以便用户识别,从而为用户解决疑问。这个APP不但更加的节省时间,而且方便网络搜索和利用。因此小甲识图将是一个实现研究甲骨文最便利的手机软件。
本软件通过OCR技术的运用,能够对目前被专家鉴定确认的所有甲骨文进行识别。实现在手机平台上的汉字转化,能够巧妙地避免用户在外出旅游时遇到生僻字或者古汉字的尴尬场面,并且还可以通过数据分析手段对所有已知的甲骨文或者其他文字进行对比,分析每个时期文字的变化,实现人们对于文字认知的提高,准确阅读文献资料,加快学者对甲骨文的研究工作。同时现在的年轻人更倾向于使用电子产品而不再去翻故纸堆,所以本产品对在年轻人在文字文学方面将有一定的推动和促进作用,更有利于传承与发扬中国汉字文化。
本项目主要针对文字识别和释义,特别是甲骨文开发的一款软件。适宜所有对中国汉字感兴趣的人,主要用户包括各年龄段的在校学生、文字爱好者和研究者以及爱好旅游的人员,帮助人们识别出不认识的文字。随着项目的进展未来将涉及小篆、隶书、草书等等字体的研究,并且可以深入推广到小学汉字义务普及教育以及高中生、大学生的中国汉字品鉴领域。
通过以Eclipse, Android SDK 作为开发平台,运用JAVA或者Python语言进行程序编写,运用HTML5和CSS技术对软件界面进行外观设计开发,使扫描软件不仅仅局限于手机App,未来还可以扩展成网站或其他基于网络的项目。同时将OCR技术运用到手机软件上对已知甲骨文进行分析、比对、核实、运用等操作。在大学学习阶段项目团队不断进行专业知识的学习和实践的积累,还有资深教师指导,保证项目团队具有开发软件的能力。在现有的条件下,软件质量能得到很好的保证。因此从技术上本项目具有可行性。
根据开发的成本和效益判断本软件开发工具的成本都较为低廉,软件编辑器和编辑程序都可以在网上免费下载,对开发者来说并不需要太高的成本支出,而且开发周期在可控范围内,节省了人力、物力、财力资源,所以本软件在经济上是可行的。
现代人都通过网络,所以只要有网络的地方便是市场、便是商机。项目可以与安阳市中国文字博物馆进行洽谈,由他们提供甲骨文的资料及相应数据图片,为项目的技术提供原始数据,而且更是响应目前国家推行汉字文化这一政策。所以项目具有可操作性。
项目可以通过在界面中为用户使用提供简单的操作菜单,让使用App的用户一眼就看到App要实现的全部功能。通过简洁的操作导航菜单来对进行软件功能进行操作和使用。还有一个更加简单的方法就是设置通知栏,使用通知栏可以直接打开直接需要的功能。综上所述,使用者可以随时随地了解甲骨文,简单、方便地阅读浏览历史文献。能有效的提高使用者对文字的认知,增加对文字的兴趣,普及甲骨文知识,获得一项新的技能。
(1) 通过手机自带的摄像头进行文字拍照,传入照片后,系统对图片进行扫描,定位,分割,识别,将文字对应的简化字呈现在系统界面中,如图2-1所示。
图2-1 家字的文字演变
(2)能根据查找的文字进行简单的文化教育及知识普及,给出该文字的起源及其演变过程。如图2-2,2-3所示。
图2-2 文字的查找界面
图2-3 家字的释义界面
(3)通过对文字的分析,可分析出文字的笔画走向。同时,使用者可通过一个田字格对文字进行一个练习。如图2-4,2-5所示。
图2-4 田字格 图2-5练习字体页面
(4)对常用汉字,给出其常用词组以及成语等内容。如图2-6,2-7。
图2-6 搜索页面2
图2-7搜索结果页面
(5)可通过搜索输入想要了解的古代文字查找到结果,同时查找到与它相似容易弄混的文字。
2.2.1 结构设计
小甲识图的功能主要包括:
(1)拍照识别:传入照片后,系统对图片进行扫描,定位,分割,识别。
(2)在搜索页面输入需要查找的字,通过系统识别搜索出其起源及演变过程。
(3)通过对文字分析,可以通过田字格对文字进行练习。
(4)通过词组搜索栏对文字进行搜索,查找出有关词组。
下面给出项目的整体架构图,如图2-8所示。
图2-8 系统结构图
2.2.2 关键技术
本项目的主要功能是对甲骨文的识别,所以通过手机摄像头去识别照片中的文字是本项目的关键点。其中包含的主要技术就是如何处理图片,识别出其中的文字并搜索对应的简体字显示给用户查看。图2-所示就是对文字识别技术的介绍。
(1)预处理技术
预处理对包含文字的图像进行处理以便后续进行特征提取、学习。这个过程主要目的是减少图像中的无用信息,以便方便后面的处理。
在这个步骤通常有:灰度化(如果是彩色图像)、降噪、二值化、字符切分以及归一化这些子步骤。经过二值化后,图像只剩下两种颜色,即黑和白,其中一个是图像背景,另一个颜色就是要识别的文字了。在拍摄照片时,噪点是不可避免的,第一步在Raw处理之后采用Lightroom/ACR全局降噪,第二步 Nik Dfine 2局部降噪,第三步蒙版抑制噪点再生和输出降噪。图象二值化是后续图象处理技术的基础,就是把图片上每个像素点变为两种值,即0和1。然后将这些数字按照原本像素点的顺序,安放到一个二维数组中去。字符切分则是将图像中的文字分割成单个文字——识别的时候是一个字一个字识别的。如果文字行有倾斜的话往往还要进行倾斜校正。归一化则是将单个的文字图像规整到同样的尺寸,在同一个规格下,才能应用统一的算法。
(2)特征提取和降维
特征选择在检测网络异常问题上起到了一个很重要的作用。在网络传输数据中有很多属性,记录网络相关信息,然而很多时候很多属性对于实际应用并没有太大帮助,反而只会浪费计算的时间和空间。因此,删除掉冗余的属性并保持对检测最重要的特征会有效的增大检测率。特征选择就提供了一种在不减少分类精确度的前提下减少数据维数的方法。特征选择处理过程主要可以分成三部分:子集生成,子集评价和子集验证,如图2-9所示。
图2-9 特征选择处理过程
子集生成有三种不同的方式:完全式、随机式和启发式。根据集合的特征进行全局最优或随机、启发式的搜索策略选择。子集评价,可以将评价算法分成3类:封装式(Wrapper)、过滤式(filter)和混合式。封装式主要是通过一些预先定义的设置标准对特征进行优化选择。过滤式依靠对训练数据的统计性能评估判断特征,一般通过五种类型的函数评价准则来判定特征之间的相关性进行选择:基于得分(score)的、基于信息度量的、基于相关性的、基于一致性的和基于检测精确度的。而模拟和实际执行则是验证特征选择子集的两种方法。
降维有图像降维和数据降维。数据降维方法分为主分量分析,它采用的是最简单的判据——方差而该方法寻找到的最优方向为投影方差最大的方向。 PCA 方法不需要对样本集进行分类, 实现起来非常简单, 但 PCA 会同时鼓励类间方差和类内方差, 类内方差是数据分类时希望抑制的。另一类判据称为类别可分离性判据 , 这类判据衡量的是数据集合中不同类之间的可分性。 首先从数据集合中选出一部分作为样本集, 然后对样本集进行分类, 最后在样本集上优化可分性判据并得到最优降维方向。 最常用的类别可分性判据为 Fisher 判据, Fisher 判据用类间距离和类内距离的比值来衡量类别之间的可分离性, 非常直观且易于寻优。
图像降维与数据降维存在着不同。数据降维处理的对象为数据集合,而图像是二维阵列, 还有着空间信息。 运用一种矩保持(Moment-Preserving)的图像降维方法, 在图像的局部邻域用零到三阶矩保持估计出每个通道的两类均值, 并赋给每个通道与均值差成正比的权重来生成灰度图像。由于同一批彩色 IC 图像在颜色和内容上存在很大的相似性, 通过样本图像寻找一个适用于全局乃至于整批图像的最佳降维方向成为可能。 在数据集合的降维中, 最优降维方向是在样本集上通过对一个判据寻优获得的。 将这个思想引入图像降维中, 这样图像降维最主要的问题同样是确定一个合适的判据, 以此来衡量图像的质量。 区域内部的平滑性和区域之间的对比度是衡量图像质量的两个重要方面, 所以将图像分割成区域后, Fisher 判据也可以用来衡量图像的质量, 类内距离和类间距离分别代表区域内部的平滑性和区域之间的对比度。 考虑到图像的空间信息, 本文将权重引入 Fisher 判据来反映区域之间的相邻关系, 称之为带权重的 Fisher 判据。 这样我们图像降维的步骤是, 先挑选样本图像,然后进行分割, 再优化带权重的 Fisher 判据, 最后用最优降维方向将同一批中的彩色图像转换成灰度图像。
(3)识别
识别算法是整个识别过程的核心部分,原始图像经过预处理后,得到一个较为理想的二值图像,然后就可以对这个处理后的二值图像进行识别,识别过程包括字符特征的提取和与标准模板进行分类识别。
- 结构模式识别
其主要的出发点是字符的组成,它是早期文字识别研究的主要方法,其识别思想是先把文字图像划分为很多个基本组合,再用结构方法描述这些基本组合所代表的结构和关系,通常抽取笔段或基本笔画作为基元,由这些基元组合及其互相关系完全可以精确地对文字加以描述,最后利用形式语言及自动机理论进行文法推断即识别。这种方法的优点是对字体变化的适应性强,区分相似字能力强。
- 统计模式识别
统计模式识别是将字符点阵看作一个整体,用概率统计模型提取待识别文字的特征向量,主要是抽取待识别模式的一组统计特征,然后按一定准则所确定的决策函数进行分类判决待识别文字的特征向量属于那一类,常见的统计模式识别方法有模板匹配,利用变换特征的方法,投影直方图法,基于微结构特征的方法等等。这种方法的优点是抗干扰能力强,匹配与分类的算法简单,易于实现。
- 统计识别与结构识别相结合
统计识别与结构识别各有优点,而网络化特征就是这两种方法结合的产物。字符图像被均匀地划分为若干区域,称之为“网络”。在每一个网格内寻找寻找各种特征,如笔划点与背景点的比例,交叉点,笔划端点的个数,细化后笔划的长度,网络部分的笔划密度等等。特征的统计以网络为单位,即使个别特点的统计有误也不会造成很大的影响,增强了特征的抗干扰性,这种方法正得到日益广泛的应用。
- 人工神经网络
这种方法是一种模拟人脑神经元细胞的网络结构,它是由大量简单的基本元件-神经元相互连接成的自适应非线性的动态系统,它具有一定的自适应的学习,组织能力,组成的网络的各个“细胞”可以并行的工作,并可以通过调整“细胞”间的连接系数完成分类,识别等复杂的功能。
(4)后处理
后处理是指对分类的结果用分类算法来提高识别率和适应率,降低系统的误识率。本产品对文字分类后的处理可能包括对块效应(马赛克)形式的图片进行去块效应过滤、细化和裁剪等操作。
(1)产品能够迅速的通过摄像头设备扫描到图片中的文本,现在很多App在输入图片时扫描不清晰,或者分辨不出来,而本产品将会优化这些劣势,增加分辨率,让图片更加的清晰易辨。
(2)产品能够更加方便人们能够迅速找到自己想要的信息,能够更好的帮助人们了解文字,认识它们。
(3)现在社会是一个现代化的文明社会,认错字或者不认得字是一个很尴尬的事情,我们的产品可以很好的帮助人们分别出相近的文字,避免造成错认,避免一些尴尬的事情发生。
(4)在生活中,我们常常要手拿起笔在纸张上才能练字,如果出门在外的话,寻找纸张费时又不方便,不利于我们随时学习汉字。本产品可在App上设置一个田字格,能够方便使用者正确规范的写出汉字,节省纸张的浪费。
(5)在中国源远流长的汉字中,每一个汉字都可以有很多种意思,可以组合成很多种词语,用到不同的地方。而本产品能够把汉字的各种意思词组清楚的列出来,方便使用者了解,使用,能够更好的普及知识。
中国文字的发展历经了一个漫长的过程,从象形文字到现在的简化汉字,文字表现形式发生了很大的变化,从古汉字笔画的复杂,到现在汉字的简化,每一笔每一划都有着它独特的韵味。随着文字的逐步向简化的方向发展,人们逐渐的舍弃了复杂的古汉字,渐渐地倾向于简化的现代汉字,以致于现如今中国文字面临最大问题:人们只知现代简体汉字,而对古汉字一窍不通,导致古文的辨识率直线下降。
比如现在的人名,很多父母为了给自己的子女寄予厚望,为他们起的名字生僻字很多,但却不认识、不了解其生僻字及其含义,而且社会上的人也不认识这些有生僻字的名字,不知到怎么读,不了解其字的释义。
人们现在越来越多的使用电脑和手机上的输入法进行文字编辑和输入,导致“提笔忘字”的现象随之变得严重,社会上的新媒体宣传时乱用同音字,误导了很多的人们对文字正确的认知。
为了改变这种现状,本团队基于OCR技术,连通域搜索和滑动窗口多尺度扫描和分类器(SVM、CNN、贝叶斯、神经网络等)设计搜索训练识别,能够快速有效的识别出文字,为使用者了解古文字提供了便利,可以让使用者了解并学习古汉字。
在当代社会,大部分的人们出现了“提笔忘字”的现象,而且这种现象比较严重。近年来,随着计算机和网络技术的普及,大众对汉字书写的依赖度出现下降,不规范使用汉字以及“提笔忘字”的现象比比皆是。
众所周知,汉字是中华文明的标志,又是传承中华文化的工具。中华民族传统文化从夏商周传承下来,汉字功不可没。汉字是我们文化的根,是滋养我们现实生存发展的血液。因此大众应该重视起来,改变这种现象,发扬我国的汉字文化。
目前大多数网站或者手机App倾向于不同语言文字的识别,比如英文到中文或者中文到日文等,几乎没有对由象形文字演化到现在的简化汉字的不同阶段的文字进行识别,因此人们对我国古汉字的了解是微乎其微,甚至是根本不认识古汉字,这就对我国的文字文化的发扬传承产生了抑制作用。
近年来,党和国家领导人多次指示要加强中小学生的书写教育,每年的人大、政协代表也纷纷提案,希望能够重视中小学生的书写能力。党的十八大明确提出要“推广和规范使用国家通用语言文字”,并将其作为文化强国战略的重要组成部分。增强国家语言实力,提高国民语言能力,构建和谐语言生活,是语言文字梦的重要内容,也是实现民族伟大复兴的中国梦的重要内容。为协助宣传、落实《中华人民共和国国家通用语言文字法》和《国家中长期语言文字事业改革和发展规划纲要》,中央电视台、国家语委、各级各类学校决定共同举办《中国汉字听写大会》、《中国成语大会》、《汉字英雄》等节目,使得汉字推广逐渐受到重视。而从我国的市场来看,关于这个汉字文化的市场少之又少,甚至微乎其微,很少有人从事这个产业的发展,相对集中度较低,从事这个行业的人未将此创意做成产品,而是在网页上进行在线翻译,译成古汉字,功能也存在局限,不能满足人们随时随地的查看学习并了解古汉字及其释义,应对这种现象,我们团队设计了这个产品创意。
4.1.1 商业竞争环境分析
纵观我国的商业市场,汉字文化市场的规模很小,从事此行业的企业等也很少,前期发展不会受到同行业的太大压制,也不会受到其他行业的影响与干扰;到了中期和后期的发展,其他行业和同行业会对此进行干预和影响,以此来影响我们产业的发展。
4.1.2 产品核心竞争力
分析与此类似的产品或者网上在线翻译古汉字,都存在着功能上的不足,比如:只能在线查询,无网时则不能查询;另外查出古汉字后,没有释义和发音,对于一些人来说认识和了解古汉字有困难,等等。对网上这种在线翻译产品,有很大的局限,对于使用者来说不方便,只能局限于电脑上网查询;而对于同类产品,功能太少,不能很好的满足使用者。
我们的产品功能强大,主要包括以下几个方面:
(1)使用者可以进行手机在线查找,也可以离线查找;
(2)手机App页面还有关于我国的汉字文化历史,可以让使用者了解我国悠久的文字文化历史;
(3)产品有语音翻译、文字拍照识别的功能,使用者可以语音查找,也可以打字输入查找,还可以拍照查找;
(4)此产品还有文字诠释发音功能,同时还举出相关例子,更能方便使用者的学习。
4.1.3市场比较竞争分析
我们对市场进行了实地调查,发现古汉字文化市场规模较小,而且已有此类产品的企业或者公司市场占有率较小,因此产品进入市场没有太大的竞争压力。其他有此类产品的企业或者公司的销售渠道不少,但不太深入,而且产品的营销推广理念也不太新颖,不能很好地吸引广大消费者。
4.2.1 市场定位
目前市场上,可以搜索到相关OCR文字识别的应用软件,但基本都是运用到电脑上,较少运用在手机上。比如网上有一个在线甲骨文转化器,此转换器的功能是将现代汉字转换为甲骨文。网上还有将现代汉字转化为小篆、象形文字等文字转换器,方便了人们。这些文字转换器的产生在于服务人们,方便了人们,让人们快捷的查到想要查到的文字,并进行转换,方便了普通人们和古汉字研究者。在日常生活学习中,人们或多或少的都会遇到不认识的文字,以及无法理解的汉字,此时人们需要及时储存这些信息,在网上或者查阅资料识别了解这些信息文字。这样的查阅方法很浪费时间,为方便每次遇到此类情况,可以更方便、更快速的查阅需要查阅的文字,为此开发基于Android手机开发APP。
4.2.2营销模式
(1)体验式营销模式
产品研发出来后,先让消费者体验一下产品的功能,如果消费者喜欢,觉得产品不错,以此进行推销;同时让消费者提出一些关于产品方面的建议,以改进产品,满足消费者的需求性。
(2)网络营销模式
将产品发布在网上,借网络的即时性、快速和传播成本费用低的特点在网上进行营销,可以有效减少成本,同时又可让广大消费者即时得知我们的产品,并能与我们联系,了解产品。
(3)一对一营销模式
与消费者一对一进行互动对话,通过互动,消费者了解我们的产品,我们了解消费者的需求,以此改变我们的经营行为,改进产品,定制适于消费者使用的产品。
(4)直销式营销模式
产品研发出来后,直接向广大消费者推销此产品,减少中间流通,以此降低成本,让消费者及时得知。
(1)App应用市场推广
应用市场也称应用商店,泛指专门为移动设备如手机、平板电脑等提供收费或者免费的应用下载服务的电子应用商店,是用户下载应用的主要渠道,因此,围绕应用市场推广App应用是非常关键的一步。
- App应用提交
通过各大下载市场、Web下载站点进行覆盖,主要包括:下载市场(Android market, App store, google play等)和Web下载站(天空、华军、非凡、绿软等)。
② 论坛
撰写关于App应用的评测软文、特色功能、所获荣誉等,进行帖子发布维护置顶,通过论坛进行发布,吸引用户的眼球。同时通过与应用市场论坛官方合作,策划利于App应用推广的活动主题,以提升App应用曝光率为目标的签到互动,让客户提前知晓App应用的品牌信息。
- 活动
通过空间、苹果App Store等渠道下载APP应用手机客户端,并给与好评,通过论坛账号把相关信息截图贴出来回复栏中,参加了本次活动的用户将会有机会获得App应用推广设置的精美奖品(比如话费、流量等)。
④ Banner广告
国内主流的应用市场每天都有上百万的手机用户进行登录并浏览,特别是Android的机锋,和IOS的威锋网,购买相应的首屏、通栏等Banner广告,可以为App应用获得大量曝光,从而提升品牌知名度,为App的推广起到强有力的推进作用。
(2)搜索推广
① 搜索百科 搜索百科作为搜索引擎自由产品,具备很高的网站权重和公信力,在搜索结果中排名靠前,因此制作App应用的搜索百科是非常必要的。
百度百科、搜搜百科、互动百科,是推广App的三个主要载体,撰写利于App应用推广的词条并通过审核,便于用户通过关键词搜到相关App应用,了解更多关于产品的详情。
② 知识问答
知识问答是树立企业口碑和产品口碑的重要渠道,搜索的互动式知识问答分享平台进行推广的重要性不言而喻,用户可以根据自身的需求,有针对性地提出问题;同时,这些答案又将作为搜索结果呈现给其他潜在用户。
问答平台包括百度知道、搜搜问问、新浪爱问、天涯问答、百度百科、维基百科等;执行步骤如下:
1)根据关键字、网民搜索习惯设定知道问题和百科文案;
2)针对App应用,完成知道答案的设计;
3)按照时间规划,完成知道问题、答案的发布,以及答案选为最优。
③ 文库
通过设计并发布文库,在搜索引擎中展现App应用的功效,可以获得良好的口碑传播。特别是上传一些App应用的产品介绍、使用评测、详细攻略等,可以更加方便用户了解和使用App应用的功能。
根据用户的搜索习惯,选择上传文库素材,并根据上传规则优化好文库文章标题并优化内容,选择国内主流平台百度文库、豆丁等进行上传。
(3) 社交媒体推广
① 微博推广
互动:关注行业内相关微博账号,保持互动,提高手机App曝光率。
活动:必要时候可以策划活动,进行微博转发等。
② 微信推广
微信内容:关于手机App产品的相关信息、功能,及时推广App发展的最新信息
小号积累:开通微信小号,每天导入目标客户群。
小号导大号:通过小号的粉丝积累推荐微信公众号,将粉丝导入到微信公众号。
微信互推:当粉丝量达到一定预期后,可以加入一些微信互推群,进行推广App。
- QQ推广
在团队每个成员的QQ空间、QQ说说以及腾讯微博中推广,再通过好友互推。
利用宣传经费印制纸质宣传单和各种海报,进行宣传。
- 介绍海报
在人流量多且可免费宣传的地方张贴海报宣传。
(2)宣传单
与合作商家商议,将宣传单曝光于商家跟用户接触的地方,并在人流量多的商场、超市旁等地方发宣传单进行宣传。
5 风险分析与防范
5.1 市场风险及其对策
通过扫图进行文字转化,一旦图片不清晰将导致翻译出现错误,多次失误可能会到时客户的流失,丧失一定的市场。但是可以通过大数据分析工作对其失误率进行降至最低,以保证对用户的信誉。
目前存在不少软件可以进行简体字转化为古体字,但是还无法做到将甲骨文转化为现代字,所以竞争风险相对较轻。
当用户碰到无法识别的甲骨文时,界面可以给用户提示,或者跳转到中国文字博物馆对未识别文字的奖励页面,激励用户对文字的研究,同时减少APP使用者的流失。
当今对甲骨文研究的人可谓是少之又少,精通甲骨文的专家也是屈指可数,所以要想更好的实现甲骨文转化为现代字仍存在不少的压力,但是根据前人的研究文献表明通过对已知的甲骨文转换还是可以行得通的。
随着网络科技的进步与发展,网络犯罪已经屡见不鲜,所以为确保知识产权被侵犯问题,应当实时进行追踪工作的开展,做到早发现早遏制。我国在保护知识产权方面,先后颁布实施了《著作权法》、《计算机软件保护条例》、《计算机软件著作登记办法》、《实施国际著作权公约的规定》、《商标法》、《反不正当竞争法》等一系列相关法律法规,形成了综合性保护体系。对于此类产权问题我们会重视技术研发,不断开发适应市场和客户的新产品。加强人才队伍建设,健全人才支撑体系。后期会通过建立专利、商标管理制度,开展自主创新、产品研发重构知识产权优势,全部巩固与保护自身的无形资产。
对于产品发展的一般性规律,绘图如下图6-1所示。
图6-1 产品生命周期图
这个阶段,小甲识图初步进入市场,需要不断适应用户需求和体验而调整和磨合,最终形成一个较为成熟的产品的过程。
这个阶段的产品规划的原则就是快速度过这个阶段,以最快的速度到达爆发点。所以这个时候,我们确定小甲识图的主要识别中国汉字的功能,快速获取用户。
这个阶段,有效用户数量会快速增长。现在的原则就是考虑增加识别的文字类型以及别的功能以延长这个阶段。更快地将有效用户转化为核心用户。
有效用户的增长明显放缓,但依旧保持稳定的增长。值得注意的是,这个阶段,核心用户的增长可能会比有效用户的增长速度更慢,但也可以更快。
在这个阶段,产品规划的原则有三个:
一、提升和强化盈利能力。
二、提升有效用户向核心用户转化的转化率。这个阶段做这种转化率的目的主要也是为了盈利。
三、改善原有产品的服务和体验等以求重新进入快速增长期。
这个阶段,活跃用户的增长几乎停滞,有效用户的增长也已经很缓慢,造成这种情况的原因很多,有竞争的因素,有目标用户已基本被覆盖的原因,也有产品本身模式不再适应市场的原因等等。但核心用户依然有可能保持一定的增长,这主要是用户的一种惯性造成的,当然,这种惯性会或快或慢地消失。而核心用户的增长往往意味着盈利能力的增强。
所以,这个阶段的产品规划原则有三个,
一、是提升有效用户向核心用户转化的转化率。
二、是提升和强化盈利能力。
三、也是这个阶段最重要的,改善原有产品的服务和体验等以求重新进入快速增长期,或者在已有用户和资源等基础上寻找和试探能再次进入快速增长期的新产品。
其实,在这个阶段,更重要的是在已有用户和资源等基础上寻找能再次进入快速增长期的新产品。因为进入稳定期,从很大程度上说明了在稳定增长期时对改进原有产品的服务和体验以求重新进入快速增长期的努力失败了。这个时候就必须要考虑新产品或对原有产品做颠覆性创新,改变原有产品的模式。
这个阶段,活跃用户和核心用户在整体上呈现一种流失的状态,而且,往往是加速度流失。
这个阶段的产品规划原则,就是想法设法再次进入快速增长期,无论是在现有的用户和资源的基础上做新产品还是改进原有产品。
(1)手机App开发应以创新为核,用户体验为主,提升开发技术为辅;
(2)App规划后期推广方式,精选合适自己的营销模式;
(3)重视售后服务和客户反馈,这样才能走得更远。
第一期:2017年完成App的开发与线上测试,主要完成 (1)系统对图片进行扫描,定位,分割,识别。(2)能根据查找的文字进行简单的文化教育及知识普及。(3)对常用汉字,给出其常用词组以及成语等内容。这些功能由团队中的技术人员负责,并邀请专业技术人员指导完善。
第二期:2018年-2019年添加(1)通过对文字的分析,可分析出文字的笔画走向。(2)对繁体字的识别和知识点的推广
第三期:2020年-2022年把文字识别扩展到篆书、草书等领域。
(1)基本信息多样化战略:严格保证首批高校信息的完整和多样化以及准确性,保证初期的实地考察和后期的不断更新。
(2)更新与服务多样性战略:不断开发和引进新的活动和服务,始终保持公司的竞争力。
(3)文化普及战略:在发展初期广泛宣传我们软件的文化,提升软件的知名度,以及在消费者心中树立本项目的地位。
(4)资本运营战略:最有效地利用资本,使之产生最大的效益
第一期项目:小甲识图系统的产品开发和市场开发。主要以郑州市为中心进行推广的宣传
目标:初步形成以小甲识图产品的雏形,为进一步发展打下坚实的基础。具体将从以下五方面着手:
• APP的研发
• 市场推广
• 制度完善
• 管理运作成熟
• 组织结构定型
第二期:通过多种形式的融资渠道进行大量融资,运用所融资金,对市场进行推广和产品的完善。同时从同行业大型的研发、制造、销售公司中,通过赠送股份、高薪聘请等激励方式,大量挖掘出色的业内科研人员和高级工程师,及有实战经验的营销人才加盟。
目标:最短时间内,将凭借资本的优势迅速提高扩张的速度,实现流程的扩张和产业链的完善。重点从以下五个方面着手:
• 市场扩展
• 生产线建设
• 技术创新及解决技术获得问题
• 管理水平提高
• 管理信息系统的正常运行
第三期项目:本项目将利用前两期积累的大量现金流和原始资本,重组及整合现有资源,改进阻碍发展的结构和制度,积极筹备上市融资。
将适当的向海外发展业务(尤其是发展中国家和地区)。从而展开大规模的国内、国际市场的开发活动。
目标:依托在国内重点城市打下得成熟销售网络和忠诚度很高的客户群,以放射状向二三线城市逐步扩张,最终编织成一张能够覆盖全国的渠道网络。
资金前期来源为创办人投资及学校资助,用于软件开发和检验,并在老生中试运行,用于完善软件。当产品已成熟稳定,各项运行体制检测完毕,引入风险投资和银行贷款,以2017届新生入学为契机,增加宣传力度,使软件使用者规模扩大,抢占市场。
(1)创办人集资:每人出1000元,启动基金将为5000*5=35000元。
(2)学院和学校资助:该项目是基于Android的APP开发,能够提高学生的动手能力和实践能力,并体现软件学院注重文化培养,鼓励创新创业,以创新性为重点研发产品的特色,国家鼓励和提倡大学生首先提高自身的创业素质并进行充分的市场调研,通过发现和识别商业机会,成立活动组织,利用各种资源,提供产品和服务,以创造价值的过程创新创业。所以学院和学校领导大力支持,前期能够获得20000元的资助。
(3)风险投资:本项目的创意具有市场可行性,可以以项目创意寻求风险投资。但是此部分资金具有不确定性,如果获得将用于产品新功能开发和宣传推广。
App的开发由团队中的技术人员负责,并邀请专业技术人员指导完善。总计预期花费10000元。
寻找专业的测试公司,对App 的安全性稳定性进行全面测试,保证产品安全可靠,并拿到产品合格证明。总花费预期在5000元。
前期主要针对学生、教育工作者,故线下宣传部分集中在9月份开学时期,其余月份的宣传以线上宣传如QQ、微信、微博等方式进行,故此部分开销以年份记,预算初期每年宣传部分花销10000元,后期每月的宣传花费为总赢利的1%,可累积。
全部流动资金的80%作为软件维护资金,此部分资金全部用于App的维护升级和新功能的开发,保证App的正常运行。
随着软件的推广,必然需要与各公众服务平台接轨,如进入App Store、安卓市场等应用商店,获得微信、微博支付、支付宝等公众支付平台的支持等,这部分的花销初期为5000元,后期每年拿出总收入的5%作为此业务拓展基金。
由以上对于资金的分析,现做表图如表7-1所示。
项目 | 资金使用范围 | 投入预算 |
1 | APP的开发 | 10,000元左右 |
2 | APP线上测试 | 5,000元左右 |
3 | 前期宣传推广 | 10,000元左右 |
4 | 聘请员工及办公费用支出 | 5,000元左右 |
5 | 平台体系构建 | 5,000元左右 |
6 | 总计 | 35,000元左右 |
表7-1前期投入预算
这里指的是除了主要的文字形式之外,持续推出可以额外付费下载的需要识别的汉字类型。附属功能例如App界面的新场景等,让收入可以持续增长。
App首页除搜索框及功能选项外,设置广告位置,向商家进行广告位招商,
商家通过缴纳广告费获得广告推送的权力。团队通过广告费获得赢利
考虑到长期发展的需要,仅通过App来获得收入毕竟有限,可以在App中搭载由团队设计的原创卡通形象,当软件使用率及使用频率升高,该卡通形象逐渐深入人心,可作为软件的形象代表。可以通过授权生产以该形象为原型的公仔、T恤等周边产品获得收入。或者在日常生活用品上印上中国古汉字,生产和售卖以获取资金。
基于前面的市场和各类的竞争分析。此APP产品通过网络渠道能满足更多的用户对教育和各类信息的追求。
(1)支出部分除初次较多的启动基金外为每个月员工工资,软件维护费用,宣传及产品维护基金。
(2)收入部分为每月广告费和新功能收费,新功能按每月收费1元计,安装率为1%,每三个月推出一项新功能,会员率按每月2%的速率递增,在此条件下。收入、支出及结余情况如下图7-1所示。
图7-1 收入、支出及结余情况
由图7-1可知,我们的在约6个月后即可实现盈利,并稳定增长,在一年半后,总盈利为80000元左右。
当我们可以获得风险投资的资金援助后,这笔资金用于扩大宣传,此后盈利费用将大幅上升。若风险投资的资金在三个月后加入,使得使用率的增长率从每月2%增至3%,广告费从20增加到25元。新功能更加强大,使用率从1%增至2%,则支出、收入、结余三者的关系将变为图7-2所示:
图7-2 风险投资后收入、支出及结余情况
由图可知,我们约5个月后开始盈利,一年半后盈利金额将达到约14万。我们相信随着此APP的不断完善与升级,将满足越来越多用户的多样化的需要。有着巨大的竞争优势。
(1)全面负责发展战略的实施、统筹各项管理工作。
(2)主持日常各项经营管理工作,组织实施年度经营计划和投资方案。
(3)协调成员间开发推广产品时出现的问题,保证团队和谐性,行使对整个团队指挥、指导、协调、监督、管理的权力,并承担执行工作指令的义务理责任:对所分管的工作全面负责。
(4)负责产品信息管理系统的建立及信息资源的配置;
负责与安阳市中国文字博物馆相关负责人洽谈,获取项目数据资源及文字图片等信息。
(1)负责对郑州市或者河南省进行市场调研,了解本地需求。
(2)协助团队总负责人制定总体市场发展战略以及市
“互联网+”大学生创新创业大赛
项目计划书
项目名称: 龟壳上的灿烂文化
项目类型: Android开发
学 校: 郑州轻工业学院
院 系: 软件学院
专 业: 移动互联网
项目负责人: 罗亚东
指导教师: 杨华
目 录
1 项目介绍
汉字是上古时期世界上各大文字体系中唯一传承至今的表意文字,包含着丰富的文化内涵和审美意蕴,是我们民族祖先智慧的结晶,是中华文明最灿烂的瑰宝之一。近代考古发现了3350多年前殷商的甲骨文,是中国最早的文字。作为炎黄子孙,了解祖国的历史发展,传承文化的魅力和精髓,是每个华夏儿女应尽的义务,义不容辞的责任。但是甲骨文上承原始刻绘符号,下启青铜铭文,对于普通人的识别非常困难。所以如何有效的识别龟壳上的这些文字正是本项目的目的所在。
1.1 项目背景
甲骨文是世界上最古老的文字之一,被认为是现代汉字的早期形式,有时候也被认为是汉字的书体之一,也是现存中国最古老的一种成熟文字。甲骨文又称契文、龟甲文或龟甲兽骨文。甲骨文是一种很重要的古汉字资料。它对保护历史文化遗产和探究文字的起源有着非常重要的意义。自1899年甲骨文在河南安阳被发现以来,目前发现有大约15万片甲骨,4500多个单字。这些甲骨文所记载的内容极为丰富,涉及到商代社会生活的诸多方面,不仅包括政治、军事、文化、社会习俗等内容,而且涉及天文、历法、医药等科学技术。从甲骨文已识别的约1500个单字来看,它已具备了“象形、会意、形声、指事、转注、假借”的造字方法,展现了中国文字的独特魅力,国内外学者对他表现出浓厚的兴趣。2016年中国文字博物馆发布《关于征集评选甲骨文释读优秀成果的奖励公告》,面向海内外公开征集甲骨文释读优秀成果,并对破译未释读甲骨文并经专家委员会鉴定通过的研究成果,给予单字奖励10万元;对存争议甲骨文做出新的释读并经专家委员会鉴定通过的研究成果,给予单字奖励5万元。由此可见,对于甲骨文识别的重视程度。
在当今,文字是人们传递信息的方式,特别是今天信息技术的飞速发展和移动互联网的快速普及,很多信息都能够通过互联网进行处理。现在,越来越多地人依靠键盘等输入工具书写,减少了手写汉字的机会,正确书写汉字的能力逐渐下降,很多年轻人连最常用的简体字都不会写,更不要说早期的草书、篆书、甲骨文等文字。
众所周知,中国的文字历史源远流长,文字发展经历了很多阶段,现在人们使用的文字是经过若干年进化之后得到的简体字,很多文献资料、历史精品部分,可是并没有多少人能够完全读懂这些文献,往往是对古代字体的不熟悉或者根本不认识。加之出于对文物的保护,基本上也不允许人们手捧龟甲兽骨进行甲骨文的研究,或者直接拿着文物去鉴别上面的文字。于是计算机辅助文字处理成为炙手可热的研究方向。但是目前为止尚未有一款手机或者计算机软件能够针对中国各种字体进行文字识别,尤其是将甲骨文准确的转化为现代简体字。所以是否有一款能够通过结合手机相机功能和识别功能的优点来处理对甲骨文的识别呢?我们的项目手机软件小甲识图就希望能够即时的把手机拍摄到的图片文字信息转换文本格式,并给出对应现代简体汉字以便用户识别,从而为用户解决疑问。这个APP不但更加的节省时间,而且方便网络搜索和利用。因此小甲识图将是一个实现研究甲骨文最便利的手机软件。
1.2 产品目的
本软件通过OCR技术的运用,能够对目前被专家鉴定确认的所有甲骨文进行识别。实现在手机平台上的汉字转化,能够巧妙地避免用户在外出旅游时遇到生僻字或者古汉字的尴尬场面,并且还可以通过数据分析手段对所有已知的甲骨文或者其他文字进行对比,分析每个时期文字的变化,实现人们对于文字认知的提高,准确阅读文献资料,加快学者对甲骨文的研究工作。同时现在的年轻人更倾向于使用电子产品而不再去翻故纸堆,所以本产品对在年轻人在文字文学方面将有一定的推动和促进作用,更有利于传承与发扬中国汉字文化。
1.3 应用领域
本项目主要针对文字识别和释义,特别是甲骨文开发的一款软件。适宜所有对中国汉字感兴趣的人,主要用户包括各年龄段的在校学生、文字爱好者和研究者以及爱好旅游的人员,帮助人们识别出不认识的文字。随着项目的进展未来将涉及小篆、隶书、草书等等字体的研究,并且可以深入推广到小学汉字义务普及教育以及高中生、大学生的中国汉字品鉴领域。
1.4 可行性分析
1.4.1 技术可行性分析
通过以Eclipse, Android SDK 作为开发平台,运用JAVA或者Python语言进行程序编写,运用HTML5和CSS技术对软件界面进行外观设计开发,使扫描软件不仅仅局限于手机App,未来还可以扩展成网站或其他基于网络的项目。同时将OCR技术运用到手机软件上对已知甲骨文进行分析、比对、核实、运用等操作。在大学学习阶段项目团队不断进行专业知识的学习和实践的积累,还有资深教师指导,保证项目团队具有开发软件的能力。在现有的条件下,软件质量能得到很好的保证。因此从技术上本项目具有可行性。
1.4.2 经济可行性分析
根据开发的成本和效益判断本软件开发工具的成本都较为低廉,软件编辑器和编辑程序都可以在网上免费下载,对开发者来说并不需要太高的成本支出,而且开发周期在可控范围内,节省了人力、物力、财力资源,所以本软件在经济上是可行的。
1.4.3 操作可行性
现代人都通过网络,所以只要有网络的地方便是市场、便是商机。项目可以与安阳市中国文字博物馆进行洽谈,由他们提供甲骨文的资料及相应数据图片,为项目的技术提供原始数据,而且更是响应目前国家推行汉字文化这一政策。所以项目具有可操作性。
项目可以通过在界面中为用户使用提供简单的操作菜单,让使用App的用户一眼就看到App要实现的全部功能。通过简洁的操作导航菜单来对进行软件功能进行操作和使用。还有一个更加简单的方法就是设置通知栏,使用通知栏可以直接打开直接需要的功能。综上所述,使用者可以随时随地了解甲骨文,简单、方便地阅读浏览历史文献。能有效的提高使用者对文字的认知,增加对文字的兴趣,普及甲骨文知识,获得一项新的技能。
2 产品服务
2.1基本功能
(1) 通过手机自带的摄像头进行文字拍照,传入照片后,系统对图片进行扫描,定位,分割,识别,将文字对应的简化字呈现在系统界面中,如图2-1所示。
图2-1 家字的文字演变
(2)能根据查找的文字进行简单的文化教育及知识普及,给出该文字的起源及其演变过程。如图2-2,2-3所示。
图2-2 文字的查找界面
图2-3 家字的释义界面
(3)通过对文字的分析,可分析出文字的笔画走向。同时,使用者可通过一个田字格对文字进行一个练习。如图2-4,2-5所示。
图2-4 田字格 图2-5练习字体页面
(4)对常用汉字,给出其常用词组以及成语等内容。如图2-6,2-7。
图2-6 搜索页面2
图2-7搜索结果页面
(5)可通过搜索输入想要了解的古代文字查找到结果,同时查找到与它相似容易弄混的文字。
2.2 产品设计
2.2.1 结构设计
小甲识图的功能主要包括:
(1)拍照识别:传入照片后,系统对图片进行扫描,定位,分割,识别。
(2)在搜索页面输入需要查找的字,通过系统识别搜索出其起源及演变过程。
(3)通过对文字分析,可以通过田字格对文字进行练习。
(4)通过词组搜索栏对文字进行搜索,查找出有关词组。
下面给出项目的整体架构图,如图2-8所示。
图2-8 系统结构图
2.2.2 关键技术
本项目的主要功能是对甲骨文的识别,所以通过手机摄像头去识别照片中的文字是本项目的关键点。其中包含的主要技术就是如何处理图片,识别出其中的文字并搜索对应的简体字显示给用户查看。图2-所示就是对文字识别技术的介绍。
(1)预处理技术
预处理对包含文字的图像进行处理以便后续进行特征提取、学习。这个过程主要目的是减少图像中的无用信息,以便方便后面的处理。
在这个步骤通常有:灰度化(如果是彩色图像)、降噪、二值化、字符切分以及归一化这些子步骤。经过二值化后,图像只剩下两种颜色,即黑和白,其中一个是图像背景,另一个颜色就是要识别的文字了。在拍摄照片时,噪点是不可避免的,第一步在Raw处理之后采用Lightroom/ACR全局降噪,第二步 Nik Dfine 2局部降噪,第三步蒙版抑制噪点再生和输出降噪。图象二值化是后续图象处理技术的基础,就是把图片上每个像素点变为两种值,即0和1。然后将这些数字按照原本像素点的顺序,安放到一个二维数组中去。字符切分则是将图像中的文字分割成单个文字——识别的时候是一个字一个字识别的。如果文字行有倾斜的话往往还要进行倾斜校正。归一化则是将单个的文字图像规整到同样的尺寸,在同一个规格下,才能应用统一的算法。
(2)特征提取和降维
特征选择在检测网络异常问题上起到了一个很重要的作用。在网络传输数据中有很多属性,记录网络相关信息,然而很多时候很多属性对于实际应用并没有太大帮助,反而只会浪费计算的时间和空间。因此,删除掉冗余的属性并保持对检测最重要的特征会有效的增大检测率。特征选择就提供了一种在不减少分类精确度的前提下减少数据维数的方法。特征选择处理过程主要可以分成三部分:子集生成,子集评价和子集验证,如图2-9所示。
图2-9 特征选择处理过程
子集生成有三种不同的方式:完全式、随机式和启发式。根据集合的特征进行全局最优或随机、启发式的搜索策略选择。子集评价,可以将评价算法分成3类:封装式(Wrapper)、过滤式(filter)和混合式。封装式主要是通过一些预先定义的设置标准对特征进行优化选择。过滤式依靠对训练数据的统计性能评估判断特征,一般通过五种类型的函数评价准则来判定特征之间的相关性进行选择:基于得分(score)的、基于信息度量的、基于相关性的、基于一致性的和基于检测精确度的。而模拟和实际执行则是验证特征选择子集的两种方法。
降维有图像降维和数据降维。数据降维方法分为主分量分析,它采用的是最简单的判据——方差而该方法寻找到的最优方向为投影方差最大的方向。 PCA 方法不需要对样本集进行分类, 实现起来非常简单, 但 PCA 会同时鼓励类间方差和类内方差, 类内方差是数据分类时希望抑制的。另一类判据称为类别可分离性判据 , 这类判据衡量的是数据集合中不同类之间的可分性。 首先从数据集合中选出一部分作为样本集, 然后对样本集进行分类, 最后在样本集上优化可分性判据并得到最优降维方向。 最常用的类别可分性判据为 Fisher 判据, Fisher 判据用类间距离和类内距离的比值来衡量类别之间的可分离性, 非常直观且易于寻优。
图像降维与数据降维存在着不同。数据降维处理的对象为数据集合,而图像是二维阵列, 还有着空间信息。 运用一种矩保持(Moment-Preserving)的图像降维方法, 在图像的局部邻域用零到三阶矩保持估计出每个通道的两类均值, 并赋给每个通道与均值差成正比的权重来生成灰度图像。由于同一批彩色 IC 图像在颜色和内容上存在很大的相似性, 通过样本图像寻找一个适用于全局乃至于整批图像的最佳降维方向成为可能。 在数据集合的降维中, 最优降维方向是在样本集上通过对一个判据寻优获得的。 将这个思想引入图像降维中, 这样图像降维最主要的问题同样是确定一个合适的判据, 以此来衡量图像的质量。 区域内部的平滑性和区域之间的对比度是衡量图像质量的两个重要方面, 所以将图像分割成区域后, Fisher 判据也可以用来衡量图像的质量, 类内距离和类间距离分别代表区域内部的平滑性和区域之间的对比度。 考虑到图像的空间信息, 本文将权重引入 Fisher 判据来反映区域之间的相邻关系, 称之为带权重的 Fisher 判据。 这样我们图像降维的步骤是, 先挑选样本图像,然后进行分割, 再优化带权重的 Fisher 判据, 最后用最优降维方向将同一批中的彩色图像转换成灰度图像。
(3)识别
识别算法是整个识别过程的核心部分,原始图像经过预处理后,得到一个较为理想的二值图像,然后就可以对这个处理后的二值图像进行识别,识别过程包括字符特征的提取和与标准模板进行分类识别。
- 结构模式识别
其主要的出发点是字符的组成,它是早期文字识别研究的主要方法,其识别思想是先把文字图像划分为很多个基本组合,再用结构方法描述这些基本组合所代表的结构和关系,通常抽取笔段或基本笔画作为基元,由这些基元组合及其互相关系完全可以精确地对文字加以描述,最后利用形式语言及自动机理论进行文法推断即识别。这种方法的优点是对字体变化的适应性强,区分相似字能力强。
- 统计模式识别
统计模式识别是将字符点阵看作一个整体,用概率统计模型提取待识别文字的特征向量,主要是抽取待识别模式的一组统计特征,然后按一定准则所确定的决策函数进行分类判决待识别文字的特征向量属于那一类,常见的统计模式识别方法有模板匹配,利用变换特征的方法,投影直方图法,基于微结构特征的方法等等。这种方法的优点是抗干扰能力强,匹配与分类的算法简单,易于实现。
- 统计识别与结构识别相结合
统计识别与结构识别各有优点,而网络化特征就是这两种方法结合的产物。字符图像被均匀地划分为若干区域,称之为“网络”。在每一个网格内寻找寻找各种特征,如笔划点与背景点的比例,交叉点,笔划端点的个数,细化后笔划的长度,网络部分的笔划密度等等。特征的统计以网络为单位,即使个别特点的统计有误也不会造成很大的影响,增强了特征的抗干扰性,这种方法正得到日益广泛的应用。
- 人工神经网络
这种方法是一种模拟人脑神经元细胞的网络结构,它是由大量简单的基本元件-神经元相互连接成的自适应非线性的动态系统,它具有一定的自适应的学习,组织能力,组成的网络的各个“细胞”可以并行的工作,并可以通过调整“细胞”间的连接系数完成分类,识别等复杂的功能。
(4)后处理
后处理是指对分类的结果用分类算法来提高识别率和适应率,降低系统的误识率。本产品对文字分类后的处理可能包括对块效应(马赛克)形式的图片进行去块效应过滤、细化和裁剪等操作。
2.3 产品优势
(1)产品能够迅速的通过摄像头设备扫描到图片中的文本,现在很多App在输入图片时扫描不清晰,或者分辨不出来,而本产品将会优化这些劣势,增加分辨率,让图片更加的清晰易辨。
(2)产品能够更加方便人们能够迅速找到自己想要的信息,能够更好的帮助人们了解文字,认识它们。
(3)现在社会是一个现代化的文明社会,认错字或者不认得字是一个很尴尬的事情,我们的产品可以很好的帮助人们分别出相近的文字,避免造成错认,避免一些尴尬的事情发生。
(4)在生活中,我们常常要手拿起笔在纸张上才能练字,如果出门在外的话,寻找纸张费时又不方便,不利于我们随时学习汉字。本产品可在App上设置一个田字格,能够方便使用者正确规范的写出汉字,节省纸张的浪费。
(5)在中国源远流长的汉字中,每一个汉字都可以有很多种意思,可以组合成很多种词语,用到不同的地方。而本产品能够把汉字的各种意思词组清楚的列出来,方便使用者了解,使用,能够更好的普及知识。
3 竞争环境分析
3.1 行业与市场分析
中国文字的发展历经了一个漫长的过程,从象形文字到现在的简化汉字,文字表现形式发生了很大的变化,从古汉字笔画的复杂,到现在汉字的简化,每一笔每一划都有着它独特的韵味。随着文字的逐步向简化的方向发展,人们逐渐的舍弃了复杂的古汉字,渐渐地倾向于简化的现代汉字,以致于现如今中国文字面临最大问题:人们只知现代简体汉字,而对古汉字一窍不通,导致古文的辨识率直线下降。
比如现在的人名,很多父母为了给自己的子女寄予厚望,为他们起的名字生僻字很多,但却不认识、不了解其生僻字及其含义,而且社会上的人也不认识这些有生僻字的名字,不知到怎么读,不了解其字的释义。
人们现在越来越多的使用电脑和手机上的输入法进行文字编辑和输入,导致“提笔忘字”的现象随之变得严重,社会上的新媒体宣传时乱用同音字,误导了很多的人们对文字正确的认知。
为了改变这种现状,本团队基于OCR技术,连通域搜索和滑动窗口多尺度扫描和分类器(SVM、CNN、贝叶斯、神经网络等)设计搜索训练识别,能够快速有效的识别出文字,为使用者了解古文字提供了便利,可以让使用者了解并学习古汉字。
3.2 对汉字文化的需求
在当代社会,大部分的人们出现了“提笔忘字”的现象,而且这种现象比较严重。近年来,随着计算机和网络技术的普及,大众对汉字书写的依赖度出现下降,不规范使用汉字以及“提笔忘字”的现象比比皆是。
众所周知,汉字是中华文明的标志,又是传承中华文化的工具。中华民族传统文化从夏商周传承下来,汉字功不可没。汉字是我们文化的根,是滋养我们现实生存发展的血液。因此大众应该重视起来,改变这种现象,发扬我国的汉字文化。
3.3市场环境分析
目前大多数网站或者手机App倾向于不同语言文字的识别,比如英文到中文或者中文到日文等,几乎没有对由象形文字演化到现在的简化汉字的不同阶段的文字进行识别,因此人们对我国古汉字的了解是微乎其微,甚至是根本不认识古汉字,这就对我国的文字文化的发扬传承产生了抑制作用。
近年来,党和国家领导人多次指示要加强中小学生的书写教育,每年的人大、政协代表也纷纷提案,希望能够重视中小学生的书写能力。党的十八大明确提出要“推广和规范使用国家通用语言文字”,并将其作为文化强国战略的重要组成部分。增强国家语言实力,提高国民语言能力,构建和谐语言生活,是语言文字梦的重要内容,也是实现民族伟大复兴的中国梦的重要内容。为协助宣传、落实《中华人民共和国国家通用语言文字法》和《国家中长期语言文字事业改革和发展规划纲要》,中央电视台、国家语委、各级各类学校决定共同举办《中国汉字听写大会》、《中国成语大会》、《汉字英雄》等节目,使得汉字推广逐渐受到重视。而从我国的市场来看,关于这个汉字文化的市场少之又少,甚至微乎其微,很少有人从事这个产业的发展,相对集中度较低,从事这个行业的人未将此创意做成产品,而是在网页上进行在线翻译,译成古汉字,功能也存在局限,不能满足人们随时随地的查看学习并了解古汉字及其释义,应对这种现象,我们团队设计了这个产品创意。
4 市场营销
4.1 商业竞争与营销策略
4.1.1 商业竞争环境分析
纵观我国的商业市场,汉字文化市场的规模很小,从事此行业的企业等也很少,前期发展不会受到同行业的太大压制,也不会受到其他行业的影响与干扰;到了中期和后期的发展,其他行业和同行业会对此进行干预和影响,以此来影响我们产业的发展。
4.1.2 产品核心竞争力
分析与此类似的产品或者网上在线翻译古汉字,都存在着功能上的不足,比如:只能在线查询,无网时则不能查询;另外查出古汉字后,没有释义和发音,对于一些人来说认识和了解古汉字有困难,等等。对网上这种在线翻译产品,有很大的局限,对于使用者来说不方便,只能局限于电脑上网查询;而对于同类产品,功能太少,不能很好的满足使用者。
我们的产品功能强大,主要包括以下几个方面:
(1)使用者可以进行手机在线查找,也可以离线查找;
(2)手机App页面还有关于我国的汉字文化历史,可以让使用者了解我国悠久的文字文化历史;
(3)产品有语音翻译、文字拍照识别的功能,使用者可以语音查找,也可以打字输入查找,还可以拍照查找;
(4)此产品还有文字诠释发音功能,同时还举出相关例子,更能方便使用者的学习。
4.1.3市场比较竞争分析
我们对市场进行了实地调查,发现古汉字文化市场规模较小,而且已有此类产品的企业或者公司市场占有率较小,因此产品进入市场没有太大的竞争压力。其他有此类产品的企业或者公司的销售渠道不少,但不太深入,而且产品的营销推广理念也不太新颖,不能很好地吸引广大消费者。
4.2 市场竞争策略
4.2.1 市场定位
目前市场上,可以搜索到相关OCR文字识别的应用软件,但基本都是运用到电脑上,较少运用在手机上。比如网上有一个在线甲骨文转化器,此转换器的功能是将现代汉字转换为甲骨文。网上还有将现代汉字转化为小篆、象形文字等文字转换器,方便了人们。这些文字转换器的产生在于服务人们,方便了人们,让人们快捷的查到想要查到的文字,并进行转换,方便了普通人们和古汉字研究者。在日常生活学习中,人们或多或少的都会遇到不认识的文字,以及无法理解的汉字,此时人们需要及时储存这些信息,在网上或者查阅资料识别了解这些信息文字。这样的查阅方法很浪费时间,为方便每次遇到此类情况,可以更方便、更快速的查阅需要查阅的文字,为此开发基于Android手机开发APP。
4.2.2营销模式
(1)体验式营销模式
产品研发出来后,先让消费者体验一下产品的功能,如果消费者喜欢,觉得产品不错,以此进行推销;同时让消费者提出一些关于产品方面的建议,以改进产品,满足消费者的需求性。
(2)网络营销模式
将产品发布在网上,借网络的即时性、快速和传播成本费用低的特点在网上进行营销,可以有效减少成本,同时又可让广大消费者即时得知我们的产品,并能与我们联系,了解产品。
(3)一对一营销模式
与消费者一对一进行互动对话,通过互动,消费者了解我们的产品,我们了解消费者的需求,以此改变我们的经营行为,改进产品,定制适于消费者使用的产品。
(4)直销式营销模式
产品研发出来后,直接向广大消费者推销此产品,减少中间流通,以此降低成本,让消费者及时得知。
4.2.3 App推广方案
(1)App应用市场推广
应用市场也称应用商店,泛指专门为移动设备如手机、平板电脑等提供收费或者免费的应用下载服务的电子应用商店,是用户下载应用的主要渠道,因此,围绕应用市场推广App应用是非常关键的一步。
- App应用提交
通过各大下载市场、Web下载站点进行覆盖,主要包括:下载市场(Android market, App store, google play等)和Web下载站(天空、华军、非凡、绿软等)。
② 论坛
撰写关于App应用的评测软文、特色功能、所获荣誉等,进行帖子发布维护置顶,通过论坛进行发布,吸引用户的眼球。同时通过与应用市场论坛官方合作,策划利于App应用推广的活动主题,以提升App应用曝光率为目标的签到互动,让客户提前知晓App应用的品牌信息。
- 活动
通过空间、苹果App Store等渠道下载APP应用手机客户端,并给与好评,通过论坛账号把相关信息截图贴出来回复栏中,参加了本次活动的用户将会有机会获得App应用推广设置的精美奖品(比如话费、流量等)。
④ Banner广告
国内主流的应用市场每天都有上百万的手机用户进行登录并浏览,特别是Android的机锋,和IOS的威锋网,购买相应的首屏、通栏等Banner广告,可以为App应用获得大量曝光,从而提升品牌知名度,为App的推广起到强有力的推进作用。
(2)搜索推广
① 搜索百科 搜索百科作为搜索引擎自由产品,具备很高的网站权重和公信力,在搜索结果中排名靠前,因此制作App应用的搜索百科是非常必要的。
百度百科、搜搜百科、互动百科,是推广App的三个主要载体,撰写利于App应用推广的词条并通过审核,便于用户通过关键词搜到相关App应用,了解更多关于产品的详情。
② 知识问答
知识问答是树立企业口碑和产品口碑的重要渠道,搜索的互动式知识问答分享平台进行推广的重要性不言而喻,用户可以根据自身的需求,有针对性地提出问题;同时,这些答案又将作为搜索结果呈现给其他潜在用户。
问答平台包括百度知道、搜搜问问、新浪爱问、天涯问答、百度百科、维基百科等;执行步骤如下:
1)根据关键字、网民搜索习惯设定知道问题和百科文案;
2)针对App应用,完成知道答案的设计;
3)按照时间规划,完成知道问题、答案的发布,以及答案选为最优。
③ 文库
通过设计并发布文库,在搜索引擎中展现App应用的功效,可以获得良好的口碑传播。特别是上传一些App应用的产品介绍、使用评测、详细攻略等,可以更加方便用户了解和使用App应用的功能。
根据用户的搜索习惯,选择上传文库素材,并根据上传规则优化好文库文章标题并优化内容,选择国内主流平台百度文库、豆丁等进行上传。
(3) 社交媒体推广
① 微博推广
互动:关注行业内相关微博账号,保持互动,提高手机App曝光率。
活动:必要时候可以策划活动,进行微博转发等。
② 微信推广
微信内容:关于手机App产品的相关信息、功能,及时推广App发展的最新信息
小号积累:开通微信小号,每天导入目标客户群。
小号导大号:通过小号的粉丝积累推荐微信公众号,将粉丝导入到微信公众号。
微信互推:当粉丝量达到一定预期后,可以加入一些微信互推群,进行推广App。
- QQ推广
在团队每个成员的QQ空间、QQ说说以及腾讯微博中推广,再通过好友互推。
4.3 基础推广
利用宣传经费印制纸质宣传单和各种海报,进行宣传。
- 介绍海报
在人流量多且可免费宣传的地方张贴海报宣传。
(2)宣传单
与合作商家商议,将宣传单曝光于商家跟用户接触的地方,并在人流量多的商场、超市旁等地方发宣传单进行宣传。
5 风险分析与防范
5.1 市场风险及其对策
通过扫图进行文字转化,一旦图片不清晰将导致翻译出现错误,多次失误可能会到时客户的流失,丧失一定的市场。但是可以通过大数据分析工作对其失误率进行降至最低,以保证对用户的信誉。
5.2 竞争风险及其对策
目前存在不少软件可以进行简体字转化为古体字,但是还无法做到将甲骨文转化为现代字,所以竞争风险相对较轻。
当用户碰到无法识别的甲骨文时,界面可以给用户提示,或者跳转到中国文字博物馆对未识别文字的奖励页面,激励用户对文字的研究,同时减少APP使用者的流失。
5.3人力资源风险及其对策
当今对甲骨文研究的人可谓是少之又少,精通甲骨文的专家也是屈指可数,所以要想更好的实现甲骨文转化为现代字仍存在不少的压力,但是根据前人的研究文献表明通过对已知的甲骨文转换还是可以行得通的。
5.4 知识产权侵犯风险及其对策
随着网络科技的进步与发展,网络犯罪已经屡见不鲜,所以为确保知识产权被侵犯问题,应当实时进行追踪工作的开展,做到早发现早遏制。我国在保护知识产权方面,先后颁布实施了《著作权法》、《计算机软件保护条例》、《计算机软件著作登记办法》、《实施国际著作权公约的规定》、《商标法》、《反不正当竞争法》等一系列相关法律法规,形成了综合性保护体系。对于此类产权问题我们会重视技术研发,不断开发适应市场和客户的新产品。加强人才队伍建设,健全人才支撑体系。后期会通过建立专利、商标管理制度,开展自主创新、产品研发重构知识产权优势,全部巩固与保护自身的无形资产。
6 成长与发展
6.1产品规划
对于产品发展的一般性规律,绘图如下图6-1所示。
图6-1 产品生命周期图
6.1.1 初步积累期
这个阶段,小甲识图初步进入市场,需要不断适应用户需求和体验而调整和磨合,最终形成一个较为成熟的产品的过程。
这个阶段的产品规划的原则就是快速度过这个阶段,以最快的速度到达爆发点。所以这个时候,我们确定小甲识图的主要识别中国汉字的功能,快速获取用户。
6.1.2快速增长期
这个阶段,有效用户数量会快速增长。现在的原则就是考虑增加识别的文字类型以及别的功能以延长这个阶段。更快地将有效用户转化为核心用户。
6.1.3稳定增长期
有效用户的增长明显放缓,但依旧保持稳定的增长。值得注意的是,这个阶段,核心用户的增长可能会比有效用户的增长速度更慢,但也可以更快。
在这个阶段,产品规划的原则有三个:
一、提升和强化盈利能力。
二、提升有效用户向核心用户转化的转化率。这个阶段做这种转化率的目的主要也是为了盈利。
三、改善原有产品的服务和体验等以求重新进入快速增长期。
6.1.4稳定期
这个阶段,活跃用户的增长几乎停滞,有效用户的增长也已经很缓慢,造成这种情况的原因很多,有竞争的因素,有目标用户已基本被覆盖的原因,也有产品本身模式不再适应市场的原因等等。但核心用户依然有可能保持一定的增长,这主要是用户的一种惯性造成的,当然,这种惯性会或快或慢地消失。而核心用户的增长往往意味着盈利能力的增强。
所以,这个阶段的产品规划原则有三个,
一、是提升有效用户向核心用户转化的转化率。
二、是提升和强化盈利能力。
三、也是这个阶段最重要的,改善原有产品的服务和体验等以求重新进入快速增长期,或者在已有用户和资源等基础上寻找和试探能再次进入快速增长期的新产品。
其实,在这个阶段,更重要的是在已有用户和资源等基础上寻找能再次进入快速增长期的新产品。因为进入稳定期,从很大程度上说明了在稳定增长期时对改进原有产品的服务和体验以求重新进入快速增长期的努力失败了。这个时候就必须要考虑新产品或对原有产品做颠覆性创新,改变原有产品的模式。
6.1.5衰退期
这个阶段,活跃用户和核心用户在整体上呈现一种流失的状态,而且,往往是加速度流失。
这个阶段的产品规划原则,就是想法设法再次进入快速增长期,无论是在现有的用户和资源的基础上做新产品还是改进原有产品。
6.2技术方向
(1)手机App开发应以创新为核,用户体验为主,提升开发技术为辅;
(2)App规划后期推广方式,精选合适自己的营销模式;
(3)重视售后服务和客户反馈,这样才能走得更远。
6.3产品发展目标
第一期:2017年完成App的开发与线上测试,主要完成 (1)系统对图片进行扫描,定位,分割,识别。(2)能根据查找的文字进行简单的文化教育及知识普及。(3)对常用汉字,给出其常用词组以及成语等内容。这些功能由团队中的技术人员负责,并邀请专业技术人员指导完善。
第二期:2018年-2019年添加(1)通过对文字的分析,可分析出文字的笔画走向。(2)对繁体字的识别和知识点的推广
第三期:2020年-2022年把文字识别扩展到篆书、草书等领域。
6.4发展战略
(1)基本信息多样化战略:严格保证首批高校信息的完整和多样化以及准确性,保证初期的实地考察和后期的不断更新。
(2)更新与服务多样性战略:不断开发和引进新的活动和服务,始终保持公司的竞争力。
(3)文化普及战略:在发展初期广泛宣传我们软件的文化,提升软件的知名度,以及在消费者心中树立本项目的地位。
(4)资本运营战略:最有效地利用资本,使之产生最大的效益
6.5未来规划
6.5.1.近期发展计划(1-2年)
第一期项目:小甲识图系统的产品开发和市场开发。主要以郑州市为中心进行推广的宣传
目标:初步形成以小甲识图产品的雏形,为进一步发展打下坚实的基础。具体将从以下五方面着手:
• APP的研发
• 市场推广
• 制度完善
• 管理运作成熟
• 组织结构定型
6.5.2中期发展计划(3—5年)
第二期:通过多种形式的融资渠道进行大量融资,运用所融资金,对市场进行推广和产品的完善。同时从同行业大型的研发、制造、销售公司中,通过赠送股份、高薪聘请等激励方式,大量挖掘出色的业内科研人员和高级工程师,及有实战经验的营销人才加盟。
目标:最短时间内,将凭借资本的优势迅速提高扩张的速度,实现流程的扩张和产业链的完善。重点从以下五个方面着手:
• 市场扩展
• 生产线建设
• 技术创新及解决技术获得问题
• 管理水平提高
• 管理信息系统的正常运行
6.5.3远期发展计划(5—10年)
第三期项目:本项目将利用前两期积累的大量现金流和原始资本,重组及整合现有资源,改进阻碍发展的结构和制度,积极筹备上市融资。
将适当的向海外发展业务(尤其是发展中国家和地区)。从而展开大规模的国内、国际市场的开发活动。
目标:依托在国内重点城市打下得成熟销售网络和忠诚度很高的客户群,以放射状向二三线城市逐步扩张,最终编织成一张能够覆盖全国的渠道网络。
7 财务分析
7.1资金来源
资金前期来源为创办人投资及学校资助,用于软件开发和检验,并在老生中试运行,用于完善软件。当产品已成熟稳定,各项运行体制检测完毕,引入风险投资和银行贷款,以2017届新生入学为契机,增加宣传力度,使软件使用者规模扩大,抢占市场。
(1)创办人集资:每人出1000元,启动基金将为5000*5=35000元。
(2)学院和学校资助:该项目是基于Android的APP开发,能够提高学生的动手能力和实践能力,并体现软件学院注重文化培养,鼓励创新创业,以创新性为重点研发产品的特色,国家鼓励和提倡大学生首先提高自身的创业素质并进行充分的市场调研,通过发现和识别商业机会,成立活动组织,利用各种资源,提供产品和服务,以创造价值的过程创新创业。所以学院和学校领导大力支持,前期能够获得20000元的资助。
(3)风险投资:本项目的创意具有市场可行性,可以以项目创意寻求风险投资。但是此部分资金具有不确定性,如果获得将用于产品新功能开发和宣传推广。
7.2资金使用分析
7.2.1 App的开发
App的开发由团队中的技术人员负责,并邀请专业技术人员指导完善。总计预期花费10000元。
7.2.2 App的线上测试
寻找专业的测试公司,对App 的安全性稳定性进行全面测试,保证产品安全可靠,并拿到产品合格证明。总花费预期在5000元。
7.2.3 App宣传推广
前期主要针对学生、教育工作者,故线下宣传部分集中在9月份开学时期,其余月份的宣传以线上宣传如QQ、微信、微博等方式进行,故此部分开销以年份记,预算初期每年宣传部分花销10000元,后期每月的宣传花费为总赢利的1%,可累积。
7.2.4 App维护所需费用
全部流动资金的80%作为软件维护资金,此部分资金全部用于App的维护升级和新功能的开发,保证App的正常运行。
7.2.5公众平台及收费平台等的获取
随着软件的推广,必然需要与各公众服务平台接轨,如进入App Store、安卓市场等应用商店,获得微信、微博支付、支付宝等公众支付平台的支持等,这部分的花销初期为5000元,后期每年拿出总收入的5%作为此业务拓展基金。
7.2.6前期投入预算
由以上对于资金的分析,现做表图如表7-1所示。
项目 | 资金使用范围 | 投入预算 |
1 | APP的开发 | 10,000元左右 |
2 | APP线上测试 | 5,000元左右 |
3 | 前期宣传推广 | 10,000元左右 |
4 | 聘请员工及办公费用支出 | 5,000元左右 |
5 | 平台体系构建 | 5,000元左右 |
6 | 总计 | 35,000元左右 |
表7-1前期投入预算
7.3盈利项目
7.3.1 持续推出更新附属功能模式
这里指的是除了主要的文字形式之外,持续推出可以额外付费下载的需要识别的汉字类型。附属功能例如App界面的新场景等,让收入可以持续增长。
7.3.2 App开发广告模式
App首页除搜索框及功能选项外,设置广告位置,向商家进行广告位招商,
商家通过缴纳广告费获得广告推送的权力。团队通过广告费获得赢利
7.3.3 线上推广线下经营附属产品模式
考虑到长期发展的需要,仅通过App来获得收入毕竟有限,可以在App中搭载由团队设计的原创卡通形象,当软件使用率及使用频率升高,该卡通形象逐渐深入人心,可作为软件的形象代表。可以通过授权生产以该形象为原型的公仔、T恤等周边产品获得收入。或者在日常生活用品上印上中国古汉字,生产和售卖以获取资金。
7.4三年内销售盈利预测
基于前面的市场和各类的竞争分析。此APP产品通过网络渠道能满足更多的用户对教育和各类信息的追求。
(1)支出部分除初次较多的启动基金外为每个月员工工资,软件维护费用,宣传及产品维护基金。
(2)收入部分为每月广告费和新功能收费,新功能按每月收费1元计,安装率为1%,每三个月推出一项新功能,会员率按每月2%的速率递增,在此条件下。收入、支出及结余情况如下图7-1所示。
图7-1 收入、支出及结余情况
由图7-1可知,我们的在约6个月后即可实现盈利,并稳定增长,在一年半后,总盈利为80000元左右。
当我们可以获得风险投资的资金援助后,这笔资金用于扩大宣传,此后盈利费用将大幅上升。若风险投资的资金在三个月后加入,使得使用率的增长率从每月2%增至3%,广告费从20增加到25元。新功能更加强大,使用率从1%增至2%,则支出、收入、结余三者的关系将变为图7-2所示:
图7-2 风险投资后收入、支出及结余情况
由图可知,我们约5个月后开始盈利,一年半后盈利金额将达到约14万。我们相信随着此APP的不断完善与升级,将满足越来越多用户的多样化的需要。有着巨大的竞争优势。
8 团队介绍
8.1 团队分配
8.1.1 团队总负责人
(1)全面负责发展战略的实施、统筹各项管理工作。
(2)主持日常各项经营管理工作,组织实施年度经营计划和投资方案。
(3)协调成员间开发推广产品时出现的问题,保证团队和谐性,行使对整个团队指挥、指导、协调、监督、管理的权力,并承担执行工作指令的义务理责任:对所分管的工作全面负责。
(4)负责产品信息管理系统的建立及信息资源的配置;
负责与安阳市中国文字博物馆相关负责人洽谈,获取项目数据资源及文字图片等信息。
8.1.2 市场负责人
(1)负责对郑州市或者河南省进行市场调研,了解本地需求。
(2)协助团队总负责人制定总体市场发展战略以及市场发展目标。
(3)制定产品的市场战略,把握产品的发展方向,提供及时的市场反馈。
(1)提高本产品网站的自然流量,提高在各大搜索引擎上的排名,增加产品知名度。
(2)负责软件程序的开发,负责产品服务器的维护与完善
(3)负责开发一些推广性的东西,帮助产品推广。
(1)处理相关客户投诉及纠纷问题,耐心回答客户提出各种问题,以良好的心态及时解决客户提出的问题和要求,提供售后服务并能解决一般投诉;
(2)配合产品和独立网站的推广宣传,编写网站各宣传资料,收集、研究和处理网络读者的意见和反馈信息。对各网站的相关内容进行质量把控,以提升网站内容质量;
负责产品财务管理和经营核算。及时准确地提供全面可靠的财务资料、会计报表和所需核算数据。制定产品财务计划,安排预算方案,监督检查预算执行情况。
“互联网+”大学生创新创业大赛
项目计划书
项目名称: 龟壳上的灿烂文化
项目类型: Android开发
学 校: 郑州轻工业学院
院 系: 软件学院
专 业: 移动互联网
项目负责人: 罗亚东
指导教师: 杨华
目 录
1 项目介绍
汉字是上古时期世界上各大文字体系中唯一传承至今的表意文字,包含着丰富的文化内涵和审美意蕴,是我们民族祖先智慧的结晶,是中华文明最灿烂的瑰宝之一。近代考古发现了3350多年前殷商的甲骨文,是中国最早的文字。作为炎黄子孙,了解祖国的历史发展,传承文化的魅力和精髓,是每个华夏儿女应尽的义务,义不容辞的责任。但是甲骨文上承原始刻绘符号,下启青铜铭文,对于普通人的识别非常困难。所以如何有效的识别龟壳上的这些文字正是本项目的目的所在。
1.1 项目背景
甲骨文是世界上最古老的文字之一,被认为是现代汉字的早期形式,有时候也被认为是汉字的书体之一,也是现存中国最古老的一种成熟文字。甲骨文又称契文、龟甲文或龟甲兽骨文。甲骨文是一种很重要的古汉字资料。它对保护历史文化遗产和探究文字的起源有着非常重要的意义。自1899年甲骨文在河南安阳被发现以来,目前发现有大约15万片甲骨,4500多个单字。这些甲骨文所记载的内容极为丰富,涉及到商代社会生活的诸多方面,不仅包括政治、军事、文化、社会习俗等内容,而且涉及天文、历法、医药等科学技术。从甲骨文已识别的约1500个单字来看,它已具备了“象形、会意、形声、指事、转注、假借”的造字方法,展现了中国文字的独特魅力,国内外学者对他表现出浓厚的兴趣。2016年中国文字博物馆发布《关于征集评选甲骨文释读优秀成果的奖励公告》,面向海内外公开征集甲骨文释读优秀成果,并对破译未释读甲骨文并经专家委员会鉴定通过的研究成果,给予单字奖励10万元;对存争议甲骨文做出新的释读并经专家委员会鉴定通过的研究成果,给予单字奖励5万元。由此可见,对于甲骨文识别的重视程度。
在当今,文字是人们传递信息的方式,特别是今天信息技术的飞速发展和移动互联网的快速普及,很多信息都能够通过互联网进行处理。现在,越来越多地人依靠键盘等输入工具书写,减少了手写汉字的机会,正确书写汉字的能力逐渐下降,很多年轻人连最常用的简体字都不会写,更不要说早期的草书、篆书、甲骨文等文字。
众所周知,中国的文字历史源远流长,文字发展经历了很多阶段,现在人们使用的文字是经过若干年进化之后得到的简体字,很多文献资料、历史精品部分,可是并没有多少人能够完全读懂这些文献,往往是对古代字体的不熟悉或者根本不认识。加之出于对文物的保护,基本上也不允许人们手捧龟甲兽骨进行甲骨文的研究,或者直接拿着文物去鉴别上面的文字。于是计算机辅助文字处理成为炙手可热的研究方向。但是目前为止尚未有一款手机或者计算机软件能够针对中国各种字体进行文字识别,尤其是将甲骨文准确的转化为现代简体字。所以是否有一款能够通过结合手机相机功能和识别功能的优点来处理对甲骨文的识别呢?我们的项目手机软件小甲识图就希望能够即时的把手机拍摄到的图片文字信息转换文本格式,并给出对应现代简体汉字以便用户识别,从而为用户解决疑问。这个APP不但更加的节省时间,而且方便网络搜索和利用。因此小甲识图将是一个实现研究甲骨文最便利的手机软件。
1.2 产品目的
本软件通过OCR技术的运用,能够对目前被专家鉴定确认的所有甲骨文进行识别。实现在手机平台上的汉字转化,能够巧妙地避免用户在外出旅游时遇到生僻字或者古汉字的尴尬场面,并且还可以通过数据分析手段对所有已知的甲骨文或者其他文字进行对比,分析每个时期文字的变化,实现人们对于文字认知的提高,准确阅读文献资料,加快学者对甲骨文的研究工作。同时现在的年轻人更倾向于使用电子产品而不再去翻故纸堆,所以本产品对在年轻人在文字文学方面将有一定的推动和促进作用,更有利于传承与发扬中国汉字文化。
1.3 应用领域
本项目主要针对文字识别和释义,特别是甲骨文开发的一款软件。适宜所有对中国汉字感兴趣的人,主要用户包括各年龄段的在校学生、文字爱好者和研究者以及爱好旅游的人员,帮助人们识别出不认识的文字。随着项目的进展未来将涉及小篆、隶书、草书等等字体的研究,并且可以深入推广到小学汉字义务普及教育以及高中生、大学生的中国汉字品鉴领域。
1.4 可行性分析
1.4.1 技术可行性分析
通过以Eclipse, Android SDK 作为开发平台,运用JAVA或者Python语言进行程序编写,运用HTML5和CSS技术对软件界面进行外观设计开发,使扫描软件不仅仅局限于手机App,未来还可以扩展成网站或其他基于网络的项目。同时将OCR技术运用到手机软件上对已知甲骨文进行分析、比对、核实、运用等操作。在大学学习阶段项目团队不断进行专业知识的学习和实践的积累,还有资深教师指导,保证项目团队具有开发软件的能力。在现有的条件下,软件质量能得到很好的保证。因此从技术上本项目具有可行性。
1.4.2 经济可行性分析
根据开发的成本和效益判断本软件开发工具的成本都较为低廉,软件编辑器和编辑程序都可以在网上免费下载,对开发者来说并不需要太高的成本支出,而且开发周期在可控范围内,节省了人力、物力、财力资源,所以本软件在经济上是可行的。
1.4.3 操作可行性
现代人都通过网络,所以只要有网络的地方便是市场、便是商机。项目可以与安阳市中国文字博物馆进行洽谈,由他们提供甲骨文的资料及相应数据图片,为项目的技术提供原始数据,而且更是响应目前国家推行汉字文化这一政策。所以项目具有可操作性。
项目可以通过在界面中为用户使用提供简单的操作菜单,让使用App的用户一眼就看到App要实现的全部功能。通过简洁的操作导航菜单来对进行软件功能进行操作和使用。还有一个更加简单的方法就是设置通知栏,使用通知栏可以直接打开直接需要的功能。综上所述,使用者可以随时随地了解甲骨文,简单、方便地阅读浏览历史文献。能有效的提高使用者对文字的认知,增加对文字的兴趣,普及甲骨文知识,获得一项新的技能。
2 产品服务
2.1基本功能
(1) 通过手机自带的摄像头进行文字拍照,传入照片后,系统对图片进行扫描,定位,分割,识别,将文字对应的简化字呈现在系统界面中,如图2-1所示。
图2-1 家字的文字演变
(2)能根据查找的文字进行简单的文化教育及知识普及,给出该文字的起源及其演变过程。如图2-2,2-3所示。
图2-2 文字的查找界面
图2-3 家字的释义界面
(3)通过对文字的分析,可分析出文字的笔画走向。同时,使用者可通过一个田字格对文字进行一个练习。如图2-4,2-5所示。
图2-4 田字格 图2-5练习字体页面
(4)对常用汉字,给出其常用词组以及成语等内容。如图2-6,2-7。
图2-6 搜索页面2
图2-7搜索结果页面
(5)可通过搜索输入想要了解的古代文字查找到结果,同时查找到与它相似容易弄混的文字。
2.2 产品设计
2.2.1 结构设计
小甲识图的功能主要包括:
(1)拍照识别:传入照片后,系统对图片进行扫描,定位,分割,识别。
(2)在搜索页面输入需要查找的字,通过系统识别搜索出其起源及演变过程。
(3)通过对文字分析,可以通过田字格对文字进行练习。
(4)通过词组搜索栏对文字进行搜索,查找出有关词组。
下面给出项目的整体架构图,如图2-8所示。
图2-8 系统结构图
2.2.2 关键技术
本项目的主要功能是对甲骨文的识别,所以通过手机摄像头去识别照片中的文字是本项目的关键点。其中包含的主要技术就是如何处理图片,识别出其中的文字并搜索对应的简体字显示给用户查看。图2-所示就是对文字识别技术的介绍。
(1)预处理技术
预处理对包含文字的图像进行处理以便后续进行特征提取、学习。这个过程主要目的是减少图像中的无用信息,以便方便后面的处理。
在这个步骤通常有:灰度化(如果是彩色图像)、降噪、二值化、字符切分以及归一化这些子步骤。经过二值化后,图像只剩下两种颜色,即黑和白,其中一个是图像背景,另一个颜色就是要识别的文字了。在拍摄照片时,噪点是不可避免的,第一步在Raw处理之后采用Lightroom/ACR全局降噪,第二步 Nik Dfine 2局部降噪,第三步蒙版抑制噪点再生和输出降噪。图象二值化是后续图象处理技术的基础,就是把图片上每个像素点变为两种值,即0和1。然后将这些数字按照原本像素点的顺序,安放到一个二维数组中去。字符切分则是将图像中的文字分割成单个文字——识别的时候是一个字一个字识别的。如果文字行有倾斜的话往往还要进行倾斜校正。归一化则是将单个的文字图像规整到同样的尺寸,在同一个规格下,才能应用统一的算法。
(2)特征提取和降维
特征选择在检测网络异常问题上起到了一个很重要的作用。在网络传输数据中有很多属性,记录网络相关信息,然而很多时候很多属性对于实际应用并没有太大帮助,反而只会浪费计算的时间和空间。因此,删除掉冗余的属性并保持对检测最重要的特征会有效的增大检测率。特征选择就提供了一种在不减少分类精确度的前提下减少数据维数的方法。特征选择处理过程主要可以分成三部分:子集生成,子集评价和子集验证,如图2-9所示。
图2-9 特征选择处理过程
子集生成有三种不同的方式:完全式、随机式和启发式。根据集合的特征进行全局最优或随机、启发式的搜索策略选择。子集评价,可以将评价算法分成3类:封装式(Wrapper)、过滤式(filter)和混合式。封装式主要是通过一些预先定义的设置标准对特征进行优化选择。过滤式依靠对训练数据的统计性能评估判断特征,一般通过五种类型的函数评价准则来判定特征之间的相关性进行选择:基于得分(score)的、基于信息度量的、基于相关性的、基于一致性的和基于检测精确度的。而模拟和实际执行则是验证特征选择子集的两种方法。
降维有图像降维和数据降维。数据降维方法分为主分量分析,它采用的是最简单的判据——方差而该方法寻找到的最优方向为投影方差最大的方向。 PCA 方法不需要对样本集进行分类, 实现起来非常简单, 但 PCA 会同时鼓励类间方差和类内方差, 类内方差是数据分类时希望抑制的。另一类判据称为类别可分离性判据 , 这类判据衡量的是数据集合中不同类之间的可分性。 首先从数据集合中选出一部分作为样本集, 然后对样本集进行分类, 最后在样本集上优化可分性判据并得到最优降维方向。 最常用的类别可分性判据为 Fisher 判据, Fisher 判据用类间距离和类内距离的比值来衡量类别之间的可分离性, 非常直观且易于寻优。
图像降维与数据降维存在着不同。数据降维处理的对象为数据集合,而图像是二维阵列, 还有着空间信息。 运用一种矩保持(Moment-Preserving)的图像降维方法, 在图像的局部邻域用零到三阶矩保持估计出每个通道的两类均值, 并赋给每个通道与均值差成正比的权重来生成灰度图像。由于同一批彩色 IC 图像在颜色和内容上存在很大的相似性, 通过样本图像寻找一个适用于全局乃至于整批图像的最佳降维方向成为可能。 在数据集合的降维中, 最优降维方向是在样本集上通过对一个判据寻优获得的。 将这个思想引入图像降维中, 这样图像降维最主要的问题同样是确定一个合适的判据, 以此来衡量图像的质量。 区域内部的平滑性和区域之间的对比度是衡量图像质量的两个重要方面, 所以将图像分割成区域后, Fisher 判据也可以用来衡量图像的质量, 类内距离和类间距离分别代表区域内部的平滑性和区域之间的对比度。 考虑到图像的空间信息, 本文将权重引入 Fisher 判据来反映区域之间的相邻关系, 称之为带权重的 Fisher 判据。 这样我们图像降维的步骤是, 先挑选样本图像,然后进行分割, 再优化带权重的 Fisher 判据, 最后用最优降维方向将同一批中的彩色图像转换成灰度图像。
(3)识别
识别算法是整个识别过程的核心部分,原始图像经过预处理后,得到一个较为理想的二值图像,然后就可以对这个处理后的二值图像进行识别,识别过程包括字符特征的提取和与标准模板进行分类识别。
- 结构模式识别
其主要的出发点是字符的组成,它是早期文字识别研究的主要方法,其识别思想是先把文字图像划分为很多个基本组合,再用结构方法描述这些基本组合所代表的结构和关系,通常抽取笔段或基本笔画作为基元,由这些基元组合及其互相关系完全可以精确地对文字加以描述,最后利用形式语言及自动机理论进行文法推断即识别。这种方法的优点是对字体变化的适应性强,区分相似字能力强。
- 统计模式识别
统计模式识别是将字符点阵看作一个整体,用概率统计模型提取待识别文字的特征向量,主要是抽取待识别模式的一组统计特征,然后按一定准则所确定的决策函数进行分类判决待识别文字的特征向量属于那一类,常见的统计模式识别方法有模板匹配,利用变换特征的方法,投影直方图法,基于微结构特征的方法等等。这种方法的优点是抗干扰能力强,匹配与分类的算法简单,易于实现。
- 统计识别与结构识别相结合
统计识别与结构识别各有优点,而网络化特征就是这两种方法结合的产物。字符图像被均匀地划分为若干区域,称之为“网络”。在每一个网格内寻找寻找各种特征,如笔划点与背景点的比例,交叉点,笔划端点的个数,细化后笔划的长度,网络部分的笔划密度等等。特征的统计以网络为单位,即使个别特点的统计有误也不会造成很大的影响,增强了特征的抗干扰性,这种方法正得到日益广泛的应用。
- 人工神经网络
这种方法是一种模拟人脑神经元细胞的网络结构,它是由大量简单的基本元件-神经元相互连接成的自适应非线性的动态系统,它具有一定的自适应的学习,组织能力,组成的网络的各个“细胞”可以并行的工作,并可以通过调整“细胞”间的连接系数完成分类,识别等复杂的功能。
(4)后处理
后处理是指对分类的结果用分类算法来提高识别率和适应率,降低系统的误识率。本产品对文字分类后的处理可能包括对块效应(马赛克)形式的图片进行去块效应过滤、细化和裁剪等操作。
2.3 产品优势
(1)产品能够迅速的通过摄像头设备扫描到图片中的文本,现在很多App在输入图片时扫描不清晰,或者分辨不出来,而本产品将会优化这些劣势,增加分辨率,让图片更加的清晰易辨。
(2)产品能够更加方便人们能够迅速找到自己想要的信息,能够更好的帮助人们了解文字,认识它们。
(3)现在社会是一个现代化的文明社会,认错字或者不认得字是一个很尴尬的事情,我们的产品可以很好的帮助人们分别出相近的文字,避免造成错认,避免一些尴尬的事情发生。
(4)在生活中,我们常常要手拿起笔在纸张上才能练字,如果出门在外的话,寻找纸张费时又不方便,不利于我们随时学习汉字。本产品可在App上设置一个田字格,能够方便使用者正确规范的写出汉字,节省纸张的浪费。
(5)在中国源远流长的汉字中,每一个汉字都可以有很多种意思,可以组合成很多种词语,用到不同的地方。而本产品能够把汉字的各种意思词组清楚的列出来,方便使用者了解,使用,能够更好的普及知识。
3 竞争环境分析
3.1 行业与市场分析
中国文字的发展历经了一个漫长的过程,从象形文字到现在的简化汉字,文字表现形式发生了很大的变化,从古汉字笔画的复杂,到现在汉字的简化,每一笔每一划都有着它独特的韵味。随着文字的逐步向简化的方向发展,人们逐渐的舍弃了复杂的古汉字,渐渐地倾向于简化的现代汉字,以致于现如今中国文字面临最大问题:人们只知现代简体汉字,而对古汉字一窍不通,导致古文的辨识率直线下降。
比如现在的人名,很多父母为了给自己的子女寄予厚望,为他们起的名字生僻字很多,但却不认识、不了解其生僻字及其含义,而且社会上的人也不认识这些有生僻字的名字,不知到怎么读,不了解其字的释义。
人们现在越来越多的使用电脑和手机上的输入法进行文字编辑和输入,导致“提笔忘字”的现象随之变得严重,社会上的新媒体宣传时乱用同音字,误导了很多的人们对文字正确的认知。
为了改变这种现状,本团队基于OCR技术,连通域搜索和滑动窗口多尺度扫描和分类器(SVM、CNN、贝叶斯、神经网络等)设计搜索训练识别,能够快速有效的识别出文字,为使用者了解古文字提供了便利,可以让使用者了解并学习古汉字。
3.2 对汉字文化的需求
在当代社会,大部分的人们出现了“提笔忘字”的现象,而且这种现象比较严重。近年来,随着计算机和网络技术的普及,大众对汉字书写的依赖度出现下降,不规范使用汉字以及“提笔忘字”的现象比比皆是。
众所周知,汉字是中华文明的标志,又是传承中华文化的工具。中华民族传统文化从夏商周传承下来,汉字功不可没。汉字是我们文化的根,是滋养我们现实生存发展的血液。因此大众应该重视起来,改变这种现象,发扬我国的汉字文化。
3.3市场环境分析
目前大多数网站或者手机App倾向于不同语言文字的识别,比如英文到中文或者中文到日文等,几乎没有对由象形文字演化到现在的简化汉字的不同阶段的文字进行识别,因此人们对我国古汉字的了解是微乎其微,甚至是根本不认识古汉字,这就对我国的文字文化的发扬传承产生了抑制作用。
近年来,党和国家领导人多次指示要加强中小学生的书写教育,每年的人大、政协代表也纷纷提案,希望能够重视中小学生的书写能力。党的十八大明确提出要“推广和规范使用国家通用语言文字”,并将其作为文化强国战略的重要组成部分。增强国家语言实力,提高国民语言能力,构建和谐语言生活,是语言文字梦的重要内容,也是实现民族伟大复兴的中国梦的重要内容。为协助宣传、落实《中华人民共和国国家通用语言文字法》和《国家中长期语言文字事业改革和发展规划纲要》,中央电视台、国家语委、各级各类学校决定共同举办《中国汉字听写大会》、《中国成语大会》、《汉字英雄》等节目,使得汉字推广逐渐受到重视。而从我国的市场来看,关于这个汉字文化的市场少之又少,甚至微乎其微,很少有人从事这个产业的发展,相对集中度较低,从事这个行业的人未将此创意做成产品,而是在网页上进行在线翻译,译成古汉字,功能也存在局限,不能满足人们随时随地的查看学习并了解古汉字及其释义,应对这种现象,我们团队设计了这个产品创意。
4 市场营销
4.1 商业竞争与营销策略
4.1.1 商业竞争环境分析
纵观我国的商业市场,汉字文化市场的规模很小,从事此行业的企业等也很少,前期发展不会受到同行业的太大压制,也不会受到其他行业的影响与干扰;到了中期和后期的发展,其他行业和同行业会对此进行干预和影响,以此来影响我们产业的发展。
4.1.2 产品核心竞争力
分析与此类似的产品或者网上在线翻译古汉字,都存在着功能上的不足,比如:只能在线查询,无网时则不能查询;另外查出古汉字后,没有释义和发音,对于一些人来说认识和了解古汉字有困难,等等。对网上这种在线翻译产品,有很大的局限,对于使用者来说不方便,只能局限于电脑上网查询;而对于同类产品,功能太少,不能很好的满足使用者。
我们的产品功能强大,主要包括以下几个方面:
(1)使用者可以进行手机在线查找,也可以离线查找;
(2)手机App页面还有关于我国的汉字文化历史,可以让使用者了解我国悠久的文字文化历史;
(3)产品有语音翻译、文字拍照识别的功能,使用者可以语音查找,也可以打字输入查找,还可以拍照查找;
(4)此产品还有文字诠释发音功能,同时还举出相关例子,更能方便使用者的学习。
4.1.3市场比较竞争分析
我们对市场进行了实地调查,发现古汉字文化市场规模较小,而且已有此类产品的企业或者公司市场占有率较小,因此产品进入市场没有太大的竞争压力。其他有此类产品的企业或者公司的销售渠道不少,但不太深入,而且产品的营销推广理念也不太新颖,不能很好地吸引广大消费者。
4.2 市场竞争策略
4.2.1 市场定位
目前市场上,可以搜索到相关OCR文字识别的应用软件,但基本都是运用到电脑上,较少运用在手机上。比如网上有一个在线甲骨文转化器,此转换器的功能是将现代汉字转换为甲骨文。网上还有将现代汉字转化为小篆、象形文字等文字转换器,方便了人们。这些文字转换器的产生在于服务人们,方便了人们,让人们快捷的查到想要查到的文字,并进行转换,方便了普通人们和古汉字研究者。在日常生活学习中,人们或多或少的都会遇到不认识的文字,以及无法理解的汉字,此时人们需要及时储存这些信息,在网上或者查阅资料识别了解这些信息文字。这样的查阅方法很浪费时间,为方便每次遇到此类情况,可以更方便、更快速的查阅需要查阅的文字,为此开发基于Android手机开发APP。
4.2.2营销模式
(1)体验式营销模式
产品研发出来后,先让消费者体验一下产品的功能,如果消费者喜欢,觉得产品不错,以此进行推销;同时让消费者提出一些关于产品方面的建议,以改进产品,满足消费者的需求性。
(2)网络营销模式
将产品发布在网上,借网络的即时性、快速和传播成本费用低的特点在网上进行营销,可以有效减少成本,同时又可让广大消费者即时得知我们的产品,并能与我们联系,了解产品。
(3)一对一营销模式
与消费者一对一进行互动对话,通过互动,消费者了解我们的产品,我们了解消费者的需求,以此改变我们的经营行为,改进产品,定制适于消费者使用的产品。
(4)直销式营销模式
产品研发出来后,直接向广大消费者推销此产品,减少中间流通,以此降低成本,让消费者及时得知。
4.2.3 App推广方案
(1)App应用市场推广
应用市场也称应用商店,泛指专门为移动设备如手机、平板电脑等提供收费或者免费的应用下载服务的电子应用商店,是用户下载应用的主要渠道,因此,围绕应用市场推广App应用是非常关键的一步。
- App应用提交
通过各大下载市场、Web下载站点进行覆盖,主要包括:下载市场(Android market, App store, google play等)和Web下载站(天空、华军、非凡、绿软等)。
② 论坛
撰写关于App应用的评测软文、特色功能、所获荣誉等,进行帖子发布维护置顶,通过论坛进行发布,吸引用户的眼球。同时通过与应用市场论坛官方合作,策划利于App应用推广的活动主题,以提升App应用曝光率为目标的签到互动,让客户提前知晓App应用的品牌信息。
- 活动
通过空间、苹果App Store等渠道下载APP应用手机客户端,并给与好评,通过论坛账号把相关信息截图贴出来回复栏中,参加了本次活动的用户将会有机会获得App应用推广设置的精美奖品(比如话费、流量等)。
④ Banner广告
国内主流的应用市场每天都有上百万的手机用户进行登录并浏览,特别是Android的机锋,和IOS的威锋网,购买相应的首屏、通栏等Banner广告,可以为App应用获得大量曝光,从而提升品牌知名度,为App的推广起到强有力的推进作用。
(2)搜索推广
① 搜索百科 搜索百科作为搜索引擎自由产品,具备很高的网站权重和公信力,在搜索结果中排名靠前,因此制作App应用的搜索百科是非常必要的。
百度百科、搜搜百科、互动百科,是推广App的三个主要载体,撰写利于App应用推广的词条并通过审核,便于用户通过关键词搜到相关App应用,了解更多关于产品的详情。
② 知识问答
知识问答是树立企业口碑和产品口碑的重要渠道,搜索的互动式知识问答分享平台进行推广的重要性不言而喻,用户可以根据自身的需求,有针对性地提出问题;同时,这些答案又将作为搜索结果呈现给其他潜在用户。
问答平台包括百度知道、搜搜问问、新浪爱问、天涯问答、百度百科、维基百科等;执行步骤如下:
1)根据关键字、网民搜索习惯设定知道问题和百科文案;
2)针对App应用,完成知道答案的设计;
3)按照时间规划,完成知道问题、答案的发布,以及答案选为最优。
③ 文库
通过设计并发布文库,在搜索引擎中展现App应用的功效,可以获得良好的口碑传播。特别是上传一些App应用的产品介绍、使用评测、详细攻略等,可以更加方便用户了解和使用App应用的功能。
根据用户的搜索习惯,选择上传文库素材,并根据上传规则优化好文库文章标题并优化内容,选择国内主流平台百度文库、豆丁等进行上传。
(3) 社交媒体推广
① 微博推广
互动:关注行业内相关微博账号,保持互动,提高手机App曝光率。
活动:必要时候可以策划活动,进行微博转发等。
② 微信推广
微信内容:关于手机App产品的相关信息、功能,及时推广App发展的最新信息
小号积累:开通微信小号,每天导入目标客户群。
小号导大号:通过小号的粉丝积累推荐微信公众号,将粉丝导入到微信公众号。
微信互推:当粉丝量达到一定预期后,可以加入一些微信互推群,进行推广App。
- QQ推广
在团队每个成员的QQ空间、QQ说说以及腾讯微博中推广,再通过好友互推。
4.3 基础推广
利用宣传经费印制纸质宣传单和各种海报,进行宣传。
- 介绍海报
在人流量多且可免费宣传的地方张贴海报宣传。
(2)宣传单
与合作商家商议,将宣传单曝光于商家跟用户接触的地方,并在人流量多的商场、超市旁等地方发宣传单进行宣传。
5 风险分析与防范
5.1 市场风险及其对策
通过扫图进行文字转化,一旦图片不清晰将导致翻译出现错误,多次失误可能会到时客户的流失,丧失一定的市场。但是可以通过大数据分析工作对其失误率进行降至最低,以保证对用户的信誉。
5.2 竞争风险及其对策
目前存在不少软件可以进行简体字转化为古体字,但是还无法做到将甲骨文转化为现代字,所以竞争风险相对较轻。
当用户碰到无法识别的甲骨文时,界面可以给用户提示,或者跳转到中国文字博物馆对未识别文字的奖励页面,激励用户对文字的研究,同时减少APP使用者的流失。
5.3人力资源风险及其对策
当今对甲骨文研究的人可谓是少之又少,精通甲骨文的专家也是屈指可数,所以要想更好的实现甲骨文转化为现代字仍存在不少的压力,但是根据前人的研究文献表明通过对已知的甲骨文转换还是可以行得通的。
5.4 知识产权侵犯风险及其对策
随着网络科技的进步与发展,网络犯罪已经屡见不鲜,所以为确保知识产权被侵犯问题,应当实时进行追踪工作的开展,做到早发现早遏制。我国在保护知识产权方面,先后颁布实施了《著作权法》、《计算机软件保护条例》、《计算机软件著作登记办法》、《实施国际著作权公约的规定》、《商标法》、《反不正当竞争法》等一系列相关法律法规,形成了综合性保护体系。对于此类产权问题我们会重视技术研发,不断开发适应市场和客户的新产品。加强人才队伍建设,健全人才支撑体系。后期会通过建立专利、商标管理制度,开展自主创新、产品研发重构知识产权优势,全部巩固与保护自身的无形资产。
6 成长与发展
6.1产品规划
对于产品发展的一般性规律,绘图如下图6-1所示。
图6-1 产品生命周期图
6.1.1 初步积累期
这个阶段,小甲识图初步进入市场,需要不断适应用户需求和体验而调整和磨合,最终形成一个较为成熟的产品的过程。
这个阶段的产品规划的原则就是快速度过这个阶段,以最快的速度到达爆发点。所以这个时候,我们确定小甲识图的主要识别中国汉字的功能,快速获取用户。
6.1.2快速增长期
这个阶段,有效用户数量会快速增长。现在的原则就是考虑增加识别的文字类型以及别的功能以延长这个阶段。更快地将有效用户转化为核心用户。
6.1.3稳定增长期
有效用户的增长明显放缓,但依旧保持稳定的增长。值得注意的是,这个阶段,核心用户的增长可能会比有效用户的增长速度更慢,但也可以更快。
在这个阶段,产品规划的原则有三个:
一、提升和强化盈利能力。
二、提升有效用户向核心用户转化的转化率。这个阶段做这种转化率的目的主要也是为了盈利。
三、改善原有产品的服务和体验等以求重新进入快速增长期。
6.1.4稳定期
这个阶段,活跃用户的增长几乎停滞,有效用户的增长也已经很缓慢,造成这种情况的原因很多,有竞争的因素,有目标用户已基本被覆盖的原因,也有产品本身模式不再适应市场的原因等等。但核心用户依然有可能保持一定的增长,这主要是用户的一种惯性造成的,当然,这种惯性会或快或慢地消失。而核心用户的增长往往意味着盈利能力的增强。
所以,这个阶段的产品规划原则有三个,
一、是提升有效用户向核心用户转化的转化率。
二、是提升和强化盈利能力。
三、也是这个阶段最重要的,改善原有产品的服务和体验等以求重新进入快速增长期,或者在已有用户和资源等基础上寻找和试探能再次进入快速增长期的新产品。
其实,在这个阶段,更重要的是在已有用户和资源等基础上寻找能再次进入快速增长期的新产品。因为进入稳定期,从很大程度上说明了在稳定增长期时对改进原有产品的服务和体验以求重新进入快速增长期的努力失败了。这个时候就必须要考虑新产品或对原有产品做颠覆性创新,改变原有产品的模式。
6.1.5衰退期
这个阶段,活跃用户和核心用户在整体上呈现一种流失的状态,而且,往往是加速度流失。
这个阶段的产品规划原则,就是想法设法再次进入快速增长期,无论是在现有的用户和资源的基础上做新产品还是改进原有产品。
6.2技术方向
(1)手机App开发应以创新为核,用户体验为主,提升开发技术为辅;
(2)App规划后期推广方式,精选合适自己的营销模式;
(3)重视售后服务和客户反馈,这样才能走得更远。
6.3产品发展目标
第一期:2017年完成App的开发与线上测试,主要完成 (1)系统对图片进行扫描,定位,分割,识别。(2)能根据查找的文字进行简单的文化教育及知识普及。(3)对常用汉字,给出其常用词组以及成语等内容。这些功能由团队中的技术人员负责,并邀请专业技术人员指导完善。
第二期:2018年-2019年添加(1)通过对文字的分析,可分析出文字的笔画走向。(2)对繁体字的识别和知识点的推广
第三期:2020年-2022年把文字识别扩展到篆书、草书等领域。
6.4发展战略
(1)基本信息多样化战略:严格保证首批高校信息的完整和多样化以及准确性,保证初期的实地考察和后期的不断更新。
(2)更新与服务多样性战略:不断开发和引进新的活动和服务,始终保持公司的竞争力。
(3)文化普及战略:在发展初期广泛宣传我们软件的文化,提升软件的知名度,以及在消费者心中树立本项目的地位。
(4)资本运营战略:最有效地利用资本,使之产生最大的效益
6.5未来规划
6.5.1.近期发展计划(1-2年)
第一期项目:小甲识图系统的产品开发和市场开发。主要以郑州市为中心进行推广的宣传
目标:初步形成以小甲识图产品的雏形,为进一步发展打下坚实的基础。具体将从以下五方面着手:
• APP的研发
• 市场推广
• 制度完善
• 管理运作成熟
• 组织结构定型
6.5.2中期发展计划(3—5年)
第二期:通过多种形式的融资渠道进行大量融资,运用所融资金,对市场进行推广和产品的完善。同时从同行业大型的研发、制造、销售公司中,通过赠送股份、高薪聘请等激励方式,大量挖掘出色的业内科研人员和高级工程师,及有实战经验的营销人才加盟。
目标:最短时间内,将凭借资本的优势迅速提高扩张的速度,实现流程的扩张和产业链的完善。重点从以下五个方面着手:
• 市场扩展
• 生产线建设
• 技术创新及解决技术获得问题
• 管理水平提高
• 管理信息系统的正常运行
6.5.3远期发展计划(5—10年)
第三期项目:本项目将利用前两期积累的大量现金流和原始资本,重组及整合现有资源,改进阻碍发展的结构和制度,积极筹备上市融资。
将适当的向海外发展业务(尤其是发展中国家和地区)。从而展开大规模的国内、国际市场的开发活动。
目标:依托在国内重点城市打下得成熟销售网络和忠诚度很高的客户群,以放射状向二三线城市逐步扩张,最终编织成一张能够覆盖全国的渠道网络。
7 财务分析
7.1资金来源
资金前期来源为创办人投资及学校资助,用于软件开发和检验,并在老生中试运行,用于完善软件。当产品已成熟稳定,各项运行体制检测完毕,引入风险投资和银行贷款,以2017届新生入学为契机,增加宣传力度,使软件使用者规模扩大,抢占市场。
(1)创办人集资:每人出1000元,启动基金将为5000*5=35000元。
(2)学院和学校资助:该项目是基于Android的APP开发,能够提高学生的动手能力和实践能力,并体现软件学院注重文化培养,鼓励创新创业,以创新性为重点研发产品的特色,国家鼓励和提倡大学生首先提高自身的创业素质并进行充分的市场调研,通过发现和识别商业机会,成立活动组织,利用各种资源,提供产品和服务,以创造价值的过程创新创业。所以学院和学校领导大力支持,前期能够获得20000元的资助。
(3)风险投资:本项目的创意具有市场可行性,可以以项目创意寻求风险投资。但是此部分资金具有不确定性,如果获得将用于产品新功能开发和宣传推广。
7.2资金使用分析
7.2.1 App的开发
App的开发由团队中的技术人员负责,并邀请专业技术人员指导完善。总计预期花费10000元。
7.2.2 App的线上测试
寻找专业的测试公司,对App 的安全性稳定性进行全面测试,保证产品安全可靠,并拿到产品合格证明。总花费预期在5000元。
7.2.3 App宣传推广
前期主要针对学生、教育工作者,故线下宣传部分集中在9月份开学时期,其余月份的宣传以线上宣传如QQ、微信、微博等方式进行,故此部分开销以年份记,预算初期每年宣传部分花销10000元,后期每月的宣传花费为总赢利的1%,可累积。
7.2.4 App维护所需费用
全部流动资金的80%作为软件维护资金,此部分资金全部用于App的维护升级和新功能的开发,保证App的正常运行。
7.2.5公众平台及收费平台等的获取
随着软件的推广,必然需要与各公众服务平台接轨,如进入App Store、安卓市场等应用商店,获得微信、微博支付、支付宝等公众支付平台的支持等,这部分的花销初期为5000元,后期每年拿出总收入的5%作为此业务拓展基金。
7.2.6前期投入预算
由以上对于资金的分析,现做表图如表7-1所示。
项目 | 资金使用范围 | 投入预算 |
1 | APP的开发 | 10,000元左右 |
2 | APP线上测试 | 5,000元左右 |
3 | 前期宣传推广 | 10,000元左右 |
4 | 聘请员工及办公费用支出 | 5,000元左右 |
5 | 平台体系构建 | 5,000元左右 |
6 | 总计 | 35,000元左右 |
表7-1前期投入预算
7.3盈利项目
7.3.1 持续推出更新附属功能模式
这里指的是除了主要的文字形式之外,持续推出可以额外付费下载的需要识别的汉字类型。附属功能例如App界面的新场景等,让收入可以持续增长。
7.3.2 App开发广告模式
App首页除搜索框及功能选项外,设置广告位置,向商家进行广告位招商,
商家通过缴纳广告费获得广告推送的权力。团队通过广告费获得赢利
7.3.3 线上推广线下经营附属产品模式
考虑到长期发展的需要,仅通过App来获得收入毕竟有限,可以在App中搭载由团队设计的原创卡通形象,当软件使用率及使用频率升高,该卡通形象逐渐深入人心,可作为软件的形象代表。可以通过授权生产以该形象为原型的公仔、T恤等周边产品获得收入。或者在日常生活用品上印上中国古汉字,生产和售卖以获取资金。
7.4三年内销售盈利预测
基于前面的市场和各类的竞争分析。此APP产品通过网络渠道能满足更多的用户对教育和各类信息的追求。
(1)支出部分除初次较多的启动基金外为每个月员工工资,软件维护费用,宣传及产品维护基金。
(2)收入部分为每月广告费和新功能收费,新功能按每月收费1元计,安装率为1%,每三个月推出一项新功能,会员率按每月2%的速率递增,在此条件下。收入、支出及结余情况如下图7-1所示。
图7-1 收入、支出及结余情况
由图7-1可知,我们的在约6个月后即可实现盈利,并稳定增长,在一年半后,总盈利为80000元左右。
当我们可以获得风险投资的资金援助后,这笔资金用于扩大宣传,此后盈利费用将大幅上升。若风险投资的资金在三个月后加入,使得使用率的增长率从每月2%增至3%,广告费从20增加到25元。新功能更加强大,使用率从1%增至2%,则支出、收入、结余三者的关系将变为图7-2所示:
图7-2 风险投资后收入、支出及结余情况
由图可知,我们约5个月后开始盈利,一年半后盈利金额将达到约14万。我们相信随着此APP的不断完善与升级,将满足越来越多用户的多样化的需要。有着巨大的竞争优势。
8 团队介绍
8.1 团队分配
8.1.1 团队总负责人
(1)全面负责发展战略的实施、统筹各项管理工作。
(2)主持日常各项经营管理工作,组织实施年度经营计划和投资方案。
(3)协调成员间开发推广产品时出现的问题,保证团队和谐性,行使对整个团队指挥、指导、协调、监督、管理的权力,并承担执行工作指令的义务理责任:对所分管的工作全面负责。
(4)负责产品信息管理系统的建立及信息资源的配置;
负责与安阳市中国文字博物馆相关负责人洽谈,获取项目数据资源及文字图片等信息。
8.1.2 市场负责人
(1)负责对郑州市或者河南省进行市场调研,了解本地需求。
(2)协助团队总负责人制定总体市场发展战略以及市场发展目标。
(3)制定产品的市场战略,把握产品的发展方向,提供及时的市场反馈。
8.1.3 技术负责人
(1)提高本产品网站的自然流量,提高在各大搜索引擎上的排名,增加产品知名度。
(2)负责软件程序的开发,负责产品服务器的维护与完善
(3)负责开发一些推广性的东西,帮助产品推广。
8.1.4 售后服务宣传负责人
(1)处理相关客户投诉及纠纷问题,耐心回答客户提出各种问题,以良好的心态及时解决客户提出的问题和要求,提供售后服务并能解决一般投诉;
(2)配合产品和独立网站的推广宣传,编写网站各宣传资料,收集、研究和处理网络读者的意见和反馈信息。对各网站的相关内容进行质量把控,以提升网站内容质量;
8.1.5 财务负责人
负责产品财务管理和经营核算。及时准确地提供全面可靠的财务资料、会计报表和所需核算数据。制定产品财务计划,安排预算方案,监督检查预算执行情况。
场发展目标。
(3)制定产品的市场战略,把握产品的发展方向,提供及时的市场反馈。
8.1.3 技术负责人
(1)提高本产品网站的自然流量,提高在各大搜索引擎上的排名,增加产品知名度。
(2)负责软件程序的开发,负责产品服务器的维护与完善
(3)负责开发一些推广性的东西,帮助产品推广。
8.1.4 售后服务宣传负责人
(1)处理相关客户投诉及纠纷问题,耐心回答客户提出各种问题,以良好的心态及时解决客户提出的问题和要求,提供售后服务并能解决一般投诉;
(2)配合产品和独立网站的推广宣传,编写网站各宣传资料,收集、研究和处理网络读者的意见和反馈信息。对各网站的相关内容进行质量把控,以提升网站内容质量;
8.1.5 财务负责人
负责产品财务管理和经营核算。及时准确地提供全面可靠的财务资料、会计报表和所需核算数据。制定产品财务计划,安排预算方案,监督检查预算执行情况。