世界上仅有56%的语言有文字,而有很多信息是不以文字存在的,而以语音、口语等口口相传。
1秒钟的语音包含16K次的采样,每次采样有256种可能(也就是说一次采样得到的信息需要使用8bit 进行存储)
训练出模型(deep model 硬train一发)
-
语音–>文字 语音识别、语音助手
-
文字–>语音
-
语音–>语音
-
文字–>文字
-
语音–>类别
-
文字–>类别
世界上仅有56%的语言有文字,而有很多信息是不以文字存在的,而以语音、口语等口口相传。
1秒钟的语音包含16K次的采样,每次采样有256种可能(也就是说一次采样得到的信息需要使用8bit 进行存储)
训练出模型(deep model 硬train一发)
语音–>文字 语音识别、语音助手
文字–>语音
语音–>语音
文字–>文字
语音–>类别
文字–>类别