goustx-CSDN博客

原创 [開發紀錄]語音辨識注意事項

這兩天為了語音辨識的資料解析度作了一些討論，1、目前使用32ms作為一個音框，每個音框有512筆資料，覆蓋率為50%，取樣率16000，取到的聲音(一個字)大約在20~30個音框，總覺得太短，若更改使用16ms，可增加音框數，但每個音框變為256筆資料，降低了轉換後的頻譜解析度，仍不利於辨識，2、嘗試更改取樣慮到32000，轉換的頻率資料雖然增加，但人聲的頻率範圍再高頻處成分不多，原範

2012-10-30 13:36:08 546

原创 [開發紀錄] 語音辨識 - QT使用

由於TI官方的C6accel太不給力，目前尚無DSP開發能力之前，只能先放棄DSP的部份，完全使用ARM進行開發，那麼不再綁定DVSDK開發環境，使用QT進行編輯，可在Linux內進行編譯測試，確認功能後再進行交叉編譯的工作，首先，先找到 QtSdk-offline-linux-x86-v1.2.1.run 以及 qt-everywhere-opensource-src-4.8.

2012-10-29 15:09:15 734

原创 [開發紀錄] 語音辨識 - 基本結構

接下來要使用DM3730進行語音辨識的開發，目前已由 MATLAB 測試完成基礎的語音辨識，進行程式轉換。10/11錄音部分已可正確錄音，並直接進行播放，在語音的能量偵測部分，出現問題，使用電腦進行錄音，儲存成WAV檔案，可正確進行判定字數，並進行FFT後作MFCC轉換出特徵值。猜測是ALSA MIXER 音量增益問題，預計調整混音音量再進行測試。10/15

2012-10-01 11:58:03 481

原创 [開發記錄] 函式庫調用 - 使用C6accel 資料庫進行FIR函式調用之其一

先前測試了FFT的使用，接下來進行FIR的測試，目前已將C6accel程式清空，主程式只保留DSP調用需要的部分，將測試碼獨立為一個副程式，才不會不小心把主程式搞壞，測試代碼如下所示:int c6accel_test_FIR(C6accel_Handle hC6accel,unsigned int nr,unsigned int nh){ float fc=(float

2012-09-27 10:43:47 2083

原创 [開發記錄] 函式庫調用 - 使用C6accel 資料庫進行FFT函式調用之其二

int c6accel_test_code(C6accel_Handle hC6accel,unsigned int n){ int i,j; float k,l; double T; short *WN16; short *inBufs; short *outBufs; int Npoint = 16; short *FFT_Value; float *testBufs;

2012-09-27 08:50:19 2073

原创 [開發記錄] 函式庫調用 - 使用C6accel 資料庫進行FFT函式調用之其一

目前需要針對聲音資料進行處理，而BeagleBoard-xM，為了聲音及影像的高速運算，使用兩個核心元件，ARM核心： Cortex-A8，目前我們的 Embedded linux 系統以及應用程式都在這顆運行；DSP核心：C64+ DSP，TI提供了C6accel的模組，將相關的影像/聲音加解碼，以及大部分需要使用的演算法，製作成函式庫形式，只須包含相關header文件，在程式中調用

2012-09-04 08:46:09 2203

原创 [開發記錄] 函式庫調用 - 使用ALSA進行音訊資料擷取之其三

在使用ALSA的API進行聲音擷取，capture部分似乎是沒問題的，但在進行playback時，產生了under run的狀況，OVERRUN ：一般是在進行Capture時，硬體buffer已滿，卻未即時取出資料，使得該筆資料丟失，而產生錯誤；UNDERRUN ：是只在進行playback時，硬體buffer已全數輸出，而來不及補充後續資料，使得資料斷掉；以上兩種情況，都稱為 XR

2012-08-29 13:44:13 2980

原创 [開發記錄] 函式庫調用 - 使用ALSA進行音訊資料擷取之其二

針對前一篇的 main (int argc, char *argv[]) 裡面的argc以及argv[]參數做個簡單解釋，argc 代表命令列的參數數量argv[] 將資料參數記錄的位置，範例： target# > ./MiniCapture default 那麼argc = 2 ， argv[0] = MiniCapture ，argv[1] = default ，

2012-08-24 16:21:54 4421

原创 [開發記錄] 函式庫調用 - 使用ALSA進行音訊資料擷取之其一

目前打算使用ALSA進行資料擷取，關於ALSA API所搜尋到的網路資料( http://equalarea.com/paul/alsa-audio.html )，其中有一段 Mini Capture程式，並作了些許修改，如底下所示：//---------------ALSA 測試程式---------------#include #include #include

2012-08-17 11:05:26 2539

原创 [開發記錄] 函式庫調用 - GPIO控制之二

參考網路資料，找到另外的IO控制文件，其中，devmem2是另外的工具程式，很容易在網路上找到相關的source code，編輯為執行檔後，讓IO控制程式可連結執行devmem2即可，System命令，可用來執行shell層命令，先將須使用的Pin腳進行設定，將BeagleBoard-xM的GPIO130設定為GPIO功能，並設定是否pull-high等相關參數，

2012-08-16 15:01:16 1217

原创 [開發記錄] 函式庫調用 - GPIO控制之一

# 學習 Embedded linux 函式庫調用先嘗試控制 GPIO 部分：每一腳都有六種功能，須由MUX設定，並且經由記憶體對應的位置控制IO。#include // C語言標準函式庫-檔案處理#include // C語言標準函式庫-通用工具#include // linux 系統函式庫#include // linux 系統函式庫#include //

2012-08-13 17:36:14 662

原创 [開發記錄] 編譯 BBxM 用的應用程式

記錄：#2 撰寫 Source Code 並使用make進行編輯 -TI的文件內的基本編輯方式，使用 Code Sourcery lite 進行編譯，在安裝DVSDK之前也會提示需安裝此工具。先建立 helloworld.c 檔案，(代碼就不在此列出，可參考DVSDK內說明文件)，以及建立Makefile檔案，另外需要Rule.make，此處直接用DVSDK內建好的檔案，在

2012-08-10 13:00:42 878

原创 [開發記錄] BBxM 系統建立

記錄：#1 建立系統檔案 -使用TI的DVSDK建構基本的linux系統，一開始安裝DVSDK4.03版，安裝好後要先執行 ./setup.sh，設定一些相關環境，依照setup.sh的script所留下的訊息，直接進行make clean 以及make all，缺少相當多工具包，將會在中途報錯。在網路上查詢，找到angstrom的版本，須搭配TI的DVSDK4.01版本，

2012-08-10 11:57:23 514

K' 記事本