c# 实现微软语音转文字
最近在做一个项目使用了微软的语音,发现微软的语音还是不错的,但是不管是微软还是百度的语音,都必须要注意音频文件的格式这一点,不然会坑死人的!
下面介绍微软语音的使用方法:
1.订阅语音
首先去微软Azure的官网,申请订阅获取密钥和终结点!
-
可以申请免费试用
注册完成如下图,获得密钥和终结点(密钥一定要记住)
-
REST API 实现语音转文字
区域选择根据你自己注册是选的地区来选择! -
语言选择
在终结点的后面要加所要转化的语言,所支持的语言可以去REST API 查看 -
注意对音频文件格式要求
音频文件的格式必须满足要求,否则出错! 如果对音频转码不清楚,可以看看这篇文章
- 下面是C# 使用REST API的代码展示
string requestUrl = "https://westus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?language=zh-CN";//所选区域的终结点
System.Net.HttpWebRequest request = (HttpWebRequest)HttpWebRequest.Create(requestUrl);
request.SendChunked = true;
request.Accept = @"application/json;text/xml";//返回数据是以JSON格式返回
request.Method = "POST";//发送请求
request.ProtocolVersion = HttpVersion.Version11;
request.ContentType = @"audio/wav;codec=audio/pcm;samplerate=16000";//描述音频数据的格式和编解码器,固定的写法!
request.Headers["Ocp-Apim-Subscription-Key"] = "密钥";
using (FileStream fs = new FileStream(音频文件的路径, FileMode.Open, FileAccess.Read))
{
byte[] buffer = null;
int bytesRead = 0;
using (Stream requestStream = request.GetRequestStream())
{
//Read 1024 raw bytes from the input audio file.
buffer = new Byte[checked((uint)Math.Min(1024, (int)fs.Length))];
while ((bytesRead = fs.Read(buffer, 0, buffer.Length)) != 0)
{
requestStream.Write(buffer, 0, bytesRead);
}
requestStream.Flush();
}
}
using (HttpWebResponse response = (HttpWebResponse)request.GetResponse())//获得请求的返回数据
{
string re = null;
using (StreamReader sr = new StreamReader(response.GetResponseStream()))
{
re = sr.ReadToEnd();//获得返回的JSON数据,语音所转的文字就在里面
}
}
}
注:如果有不懂的地方,可以去微软REST API 看看!