计算机基础之数字文本处理技术和文本输入方法

数字文本处理技术

文本是人们通信的主要方式。在计算机中,文字是人与计算机之间信息交换的主要媒体,文字用二进制编码表示,也就是使用不同的编码来代表不同的文字。文本是各种文字的集合,是使用最多的一种符号媒体形式,是人与计算机交互作用的主要形式。文本是计算机文字处理程序的基础,也是多媒体应用程序的基础。常用的文本文件格式有TXT、RTF、DOC以及DOT等。

在制作多媒体作品时,虽然常用的多媒体制作软件中都有文字编辑功能,但对于大量的文字信息一般不在集成时输入,而是预先在字处理软件中输入所需的文字信息后,再将其导入到多媒体制作软件中,这时就需要考虑文件的格式,因为有些多媒体制作软件可能不支持该种类型的格式,导致文件无法导入。在多媒体作品中,文本除了以文字的形式存在,还会以图像的形式存在,这种形式多用于需要将文字以特殊效果表现出来,且在多媒体集成软件中又较难实现的情况

文本输入方法

用计算机生成一个电子文本,首先要将字符输入到计算机中,就要使用字符输入法,输入字符的方法有人工输入和自动识别输入两类。

  • 人工输入是指通过键盘、手写笔或语音输入方式输入字符,它的特点是速度慢、成本高,不适合处理大批量文字。
  • 自动识别输入分为印刷体识别和手写体识别,是将纸介质上的文本通过识别技术自动转换为文字的编码,它的特点是速度快、效率高。

字符输入的方法还可分为键盘输入法非键盘输入法两类

键盘输入法

键盘输人法,就是利用键盘,根据一定的编码规则来输入汉字的一种方法。英文字母只有26个,它们对应着键盘上的26个字母,所以对于英文而言是不存在什么输入法的。汉字有几万个,它们和键盘是没有任何对应关系的,但为了向计算机中输人汉字,人们将汉字拆分成更小的部件,并将这些部件与键盘上的键产生某种联系,再通过键盘按照某种规律输入汉字,这就是汉字编码。汉字编码应具备的基本要求是易学、易记、易懂、易推广、易使用、效率高。

作为一种图形文字,汉字是由字的音、形、义来共同表达的,汉字输入的编码方法,基本上都是采用将音、形、义与特定的键相联系,再根据不同汉字进行组合来完成汉字的输入。不同输入法各有各的特点和优势

非键盘输入法

使用键盘向计算机输人汉字并不适合所有用户,也不能适用于各种不同的应用场合。为此,人们研究并开发了多种非键盘的输人方法。例如,联机手写输入系统是用输入笔在一块特殊的书写板上写字,计算机中的识别软件根据采集到的笔迹之间的位置关系和时间关系信息来识别所写的字。

文字的扫描输入是通过扫描仪将纸上的文字变成计算机可处理的信息,一般用于大量文字的快速录入。语音输入文字是将输入的文字用规范的读音朗读出来,通过话筒等输入设备送入计算机中,然后经语音识别系统进行识别,再转换成文本文件显示、存储。

  • 6
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值