音频文件提出了挑战为计算机取证和电子发现

音频文件提出了挑战为计算机取证和电子发现   统一通信是用于整合所有通信术语 - 在互联网上 - 数据和语音。这可以包括在它无数的形式,如电子邮件,即时消息数据,由业务计算机应用,传真和短信所产生的数据。但主要来​​源包括通过网络渠道发送语音或存储在数字设备,如VOIP(互联网语音协议),语音邮件,音频,视频,网络会议,白板,和。wav文件。这种集成通信可以节省资金经营预算。   储蓄从与,破除累积以及其他费用,长途电话费使用VOIP时,从与旅行的需要时,他们可以在虚拟环境中举行会议,或从旅游到遥远的班当教员或分配团队可以使用白板来自不同的物理位置。像这些储蓄计入企业的26%已采用它们。但是,当诉讼要求发现的数据。WAV和基于语音的文件可以是困难和昂贵的计算机取证专家或电子发现系统搜索和索引。   有专为搜索文本文件的许多工具,甚至从已删除的文件的文本。这些范围从计算机取证套件,例如包围和访问法医工具包,每个成本数千美元,开源工具,包括十六进制编辑器,成本,用户什么都没有。在更广泛的包可能在计费时,人类将被添加到混合从长远来看更便宜。   有许多疯狂昂贵的电子发现系统来帮助存储和索引的数量庞大的数据在企业环境中,每天产生的。这些服务被外包,或在公司提出。再次把制度和程序到位的成本可能苍白反对制裁和罚款,可能导致没有准备好诉讼,它应该出现的。   也有许多有效的工具来扫描纸质文档转换为文本文件,然后搜索。   虽然许多搜索和存储数据的工具是有效的,准确的,当涉及到音频,精度没有这样的级别或缓解但存在用于搜索特定信息的目的。目前有三种方式搜索音频:拼音搜索,用手抄录,并自动转录。   语音搜索技术相匹配的波浪模式,或者音素,已知波模式库。 “_B _IY _T _UW _B _IY”(来自Nexidia,一个涉及语音识别系统公司维基百科为例):例如,首字母缩写词“B2B”将通过下面的音素表示。鉴于在口语,发音,口音和方言的模式差异很大,这种方法的准确性是参差不齐。它会产生许多虚假点击。虽然它可以识别部分和词组,是利益,它不转录音频转换成文本 - 声音必须被倾听。   音频的手动转录,使转录的文本,然后可以自动搜索,非常耗时。因为它依赖于一个侦听,因为它们是听到键入单词,这种劳动密集的任务也可以是非常昂贵的。可能有安全问题,作为音频推移,公司(或者国家)以外的被转录。   机转录音频转换为文本的一个自动化的手段。但患有精度问题。它比较“听说”的音频与已知的图书馆,再次面临着不同的发音问题,条款不是在现有的库,和清晰度录像。而高品质的录音可以借给自己85%左右的识别率(正看的号码,直到与纯文本搜索的近100%的准确率比较),当带语音留言的处理,准确度骤降下来低至40% 。   民事诉讼的新的联邦规则(FRCP)要求公司必须确定主要的通信和数据源的方法。数据必须被保存。为了提高效率,无论是在所需的存储量的优化,并减少数据必须被识别和产生诉讼的体积,它也是重要的是能够准确地识别该数据是不必要的。   虽然保留其数据增长和存储成本的要求下,确定什么音频应该保持的,应当删除哪些可能是昂贵的。由于这些信息是数字化的,它也必须被存储和索引(或事后搜查)。该技术还不成熟,而且是不断发展的。可能有一个开口,一个创新的公司在这里蓬勃发展,特别是如果能够产生某种突破,语音到文本的技术。与此同时,公司在决定留什么去面对一个棘手的问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值