语音编程之Text-To-Speech编程技术(4)

最新推荐文章于 2023-05-26 10:24:21 发布

qianjintianguo

最新推荐文章于 2023-05-26 10:24:21 发布

阅读量2.8k

点赞数

分类专栏：音频开发文章标签：编程 character microsoft include preprocessor dialog

音频开发专栏收录该内容

13 篇文章 1 订阅

订阅专栏

如果不想处理有关语言的细节问题，只想显示和选择系统可提供的语音引擎，则可以直接调用Speech SDK提供的两个帮助函数SpInitTokenComboBox和SpInitTokenListBox来实现语音语言的显示和选择，其代码如下：

HRESULT SpInitTokenComboBox(

HWND hwnd,

const WCHAR* pszCatName,

const WCHAR* pszRequiredAttrib = NULL,

const WCHAR* pszOptionalAttrib = NULL

);

HRESULT SpInitTokenListBox(

HWND hwnd,

const WCHAR* pszCatName,

const WCHAR* pszRequiredAttrib = NULL,

const WCHAR* pszOptionalAttrib = NULL

);

CText2Speech类具有很好的错误处理机制。一旦调用某个函数发生了错误，响应的错误信息都将存放在m_sError数据成员中。可通过GetErrorString函数来获得错误描述。

11.2.2 示例：用CText2Speech类编制文字朗读程序

下面使用CText2Speech类来编写一个文字朗读程序Reciter，其界面如图11-3所示。

用Visual C++编制Reciter的步骤和要点如下：

1）使用AppWizard生成一个基于对话框的项目Reciter。

2）将Text2Speech.H，Text2Speech.CPP增加到Reciter项目中。

3）在资源编辑器中编辑好响应的控件。

4）用ClassWizard为控件在CReciterDlg 类中生成相应的成员。

5）修改ReciterDlg.h文件，为类CReciterDlg增加相应的变量和函数。

6）用ClassWizard为CReciterDlg 类添加对控件和消息的响应函数。ReciterDlg.h的代码如下所示：

#include "Text2Speech.h"

// CONTANTS OF MOUTH

#define CHARACTER_WIDTH 128

#define CHARACTER_HEIGHT 128

#define WEYESNAR 14 // eye positions

#define WEYESCLO 15

// Mouth Mapping Array (from Microsoft's TTSApp Example)

const int g_iMapVisemeToImage[22] =

{

0, // SP_VISEME_0 = 0, // Silence

11, // SP_VISEME_1, // AE, AX, AH

11, // SP_VISEME_2, // AA

11, // SP_VISEME_3, // AO

10, // SP_VISEME_4, // EY, EH, UH

11, // SP_VISEME_5, // ER

9, // SP_VISEME_6, // y, IY, IH, IX

2, // SP_VISEME_7, // w, UW

13, // SP_VISEME_8, // OW

9, // SP_VISEME_9, // AW

12, // SP_VISEME_10, // OY

11, // SP_VISEME_11, // AY

9, // SP_VISEME_12, // h

3, // SP_VISEME_13, // r

6, // SP_VISEME_14, // l

7, // SP_VISEME_15, // s, z

8, // SP_VISEME_16, // SH, CH, JH, ZH

5, // SP_VISEME_17, // TH, DH

4, // SP_VISEME_18, // f, v

7, // SP_VISEME_19, // d, t, n

9, // SP_VISEME_20, // k, g, NG

1 // SP_VISEME_21, // p, b, m

};

// CReciterDlg dialog

class CReciterDlg : public CDialog

{

// Construction

public:

CReciterDlg(CWnd* pParent = NULL); // standard constructor

// Dialog Data

//{{AFX_DATA(CReciterDlg)

enum { IDD = IDD_RECITER_DIALOG };

CStatic m_cMouth;

CListBox m_ListVoices;

CString m_strText;

//}}AFX_DATA

// ClassWizard generated virtual function overrides

//{{AFX_VIRTUAL(CReciterDlg)

protected:

virtual void DoDataExchange(CDataExchange* pDX); // DDX/DDV support

//}}AFX_VIRTUAL

CText2Speech m_Text2Speech;

void InitText2Speech();

void InitMouthImageList();

private:

CImageList m_cMouthList;

Int m_iMouthBmp;

CRect m_cMouthRect;

// Implementation

protected:

HICON m_hIcon;

// Generated message map functions

//{{AFX_MSG(CReciterDlg)

virtual BOOL OnInitDialog();

afx_msg void OnSysCommand(UINT nID, LPARAM lParam);

afx_msg void OnPaint();

afx_msg HCURSOR OnQueryDragIcon();

afx_msg void OnButtonSpeak();

afx_msg void OnSelchangeList1();

afx_msg void OnButtonStop();

afx_msg void OnButtonResume();

//}}AFX_MSG

afx_msg LRESULT OnMouthEvent(WPARAM, LPARAM);

DECLARE_MESSAGE_MAP()

};

注意，在CReciterDlg类中定义了一个CText2Speech类的对象。

7）在ReciterDlg.cpp中编写各成员函数的代码。成员函数InitText2Speech用于初始化语音引擎并找出系统中的所有语音语言，显示在语音列表中，其代码如下所示：

void CReciterDlg::InitText2Speech()

{

if (! m_Text2Speech.Initialize(m_hWnd))

AfxMessageBox(m_Text2Speech.GetErrorString());

long lCount = m_Text2Speech.GetVoiceCount();

WCHAR* pszID;

for (long l=0; l<lCount; ++l)

{

m_Text2Speech.GetVoice(&pszID, l);

m_ListVoices.AddString(CString(pszID));

}

m_Text2Speech.GetVoice(&pszID, -1);

m_ListVoices.SelectString(0, CString(pszID));

}

成员函数InitMouthImageList用于初始化朗读者图像列表，其代码如下：

void CReciterDlg::InitMouthImageList()

{

m_cMouth.GetClientRect(&m_cMouthRect);

m_cMouth.ClientToScreen(&m_cMouthRect);

ScreenToClient(&m_cMouthRect);

m_cMouth.ShowWindow(SW_HIDE);

CBitmap bmp;

m_cMouthList.Create(CHARACTER_WIDTH, CHARACTER_HEIGHT, ILC_COLOR32 | ILC_MASK, 1, 0);

bmp.LoadBitmap(MAKEINTRESOURCE(IDB_MICFULL));