自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

K' 記事本

打雜心得及瑣事

  • 博客(13)
  • 收藏
  • 关注

原创 [開發紀錄]語音辨識注意事項

這兩天為了語音辨識的資料解析度作了一些討論,1、目前使用32ms作為一個音框,每個音框有512筆資料,覆蓋率為50%,取樣率16000,取到的聲音(一個字)大約在20~30個音框,總覺得太短,若更改使用16ms,可增加音框數,但每個音框變為256筆資料,降低了轉換後的頻譜解析度,仍不利於辨識,2、嘗試更改取樣慮到32000,轉換的頻率資料雖然增加,但人聲的頻率範圍再高頻處成分不多,原範

2012-10-30 13:36:08 542

原创 [開發紀錄] 語音辨識 - QT使用

由於TI官方的C6accel太不給力,目前尚無DSP開發能力之前,只能先放棄DSP的部份,完全使用ARM進行開發,那麼不再綁定DVSDK開發環境,使用QT進行編輯,可在Linux內進行編譯測試,確認功能後再進行交叉編譯的工作, 首先,先找到 QtSdk-offline-linux-x86-v1.2.1.run 以及 qt-everywhere-opensource-src-4.8.

2012-10-29 15:09:15 727

原创 [開發紀錄] 語音辨識 - 基本結構

接下來要使用DM3730進行語音辨識的開發,目前已由 MATLAB 測試完成基礎的語音辨識,進行程式轉換。10/11錄音部分已可正確錄音,並直接進行播放,在語音的能量偵測部分,出現問題,使用電腦進行錄音,儲存成WAV檔案,可正確進行判定字數,並進行FFT後作MFCC轉換出特徵值。猜測是ALSA MIXER 音量增益問題,預計調整混音音量再進行測試。10/15

2012-10-01 11:58:03 472

原创 [開發記錄] 函式庫調用 - 使用C6accel 資料庫進行FIR函式調用 之其一

先前測試了FFT的使用,接下來進行FIR的測試,目前已將C6accel程式清空,主程式只保留DSP調用需要的部分,將測試碼獨立為一個副程式,才不會不小心把主程式搞壞,測試代碼如下所示:int c6accel_test_FIR(C6accel_Handle hC6accel,unsigned int nr,unsigned int nh){ float fc=(float

2012-09-27 10:43:47 2081

原创 [開發記錄] 函式庫調用 - 使用C6accel 資料庫進行FFT函式調用 之其二

int c6accel_test_code(C6accel_Handle hC6accel,unsigned int n){ int i,j; float k,l; double T; short *WN16; short *inBufs; short *outBufs; int Npoint = 16; short *FFT_Value; float *testBufs;

2012-09-27 08:50:19 2067

原创 [開發記錄] 函式庫調用 - 使用C6accel 資料庫進行FFT函式調用 之其一

目前需要針對聲音資料進行處理,而BeagleBoard-xM,為了聲音及影像的高速運算,使用兩個核心元件,ARM核心: Cortex-A8,目前我們的 Embedded linux 系統以及應用程式都在這顆運行;DSP核心:C64+ DSP,TI提供了C6accel的模組,將相關的影像/聲音加解碼,以及大部分需要使用的演算法,製作成函式庫形式,只須包含相關header文件,在程式中調用

2012-09-04 08:46:09 2198

原创 [開發記錄] 函式庫調用 - 使用ALSA進行音訊資料擷取 之其三

在使用ALSA的API進行聲音擷取,capture部分似乎是沒問題的,但在進行playback時,產生了under run的狀況,OVERRUN :一般是在進行Capture時,硬體buffer已滿,卻未即時取出資料,使得該筆資料丟失,而產生錯誤;UNDERRUN :是只在進行playback時,硬體buffer已全數輸出,而來不及補充後續資料,使得資料斷掉;以上兩種情況,都稱為 XR

2012-08-29 13:44:13 2976

原创 [開發記錄] 函式庫調用 - 使用ALSA進行音訊資料擷取 之其二

針對前一篇的 main (int argc, char *argv[]) 裡面的argc以及argv[]參數做個簡單解釋,argc 代表命令列的參數數量argv[] 將資料參數 記錄的位置,範例: target# > ./MiniCapture default 那麼argc = 2 , argv[0] = MiniCapture ,argv[1] = default ,

2012-08-24 16:21:54 4397

原创 [開發記錄] 函式庫調用 - 使用ALSA進行音訊資料擷取 之其一

目前打算使用ALSA進行資料擷取,關於ALSA API所搜尋到的網路資料( http://equalarea.com/paul/alsa-audio.html ),其中有一段 Mini Capture程式,並作了些許修改,如底下所示://---------------ALSA 測試程式---------------#include #include #include

2012-08-17 11:05:26 2528

原创 [開發記錄] 函式庫調用 - GPIO控制 之二

參考網路資料,找到另外的IO控制文件,其中,devmem2是另外的工具程式,很容易在網路上找到相關的source code,編輯為執行檔後,讓IO控制程式可連結執行devmem2即可,System命令,可用來執行shell層命令,先將須使用的Pin腳進行設定,將BeagleBoard-xM的GPIO130設定為GPIO功能,並設定是否pull-high等相關參數,

2012-08-16 15:01:16 1209

原创 [開發記錄] 函式庫調用 - GPIO控制 之一

# 學習 Embedded linux 函式庫調用先嘗試控制 GPIO 部分:每一腳都有六種功能,須由MUX設定,並且經由記憶體對應的位置控制IO。#include // C語言標準函式庫-檔案處理#include // C語言標準函式庫-通用工具#include // linux 系統函式庫#include // linux 系統函式庫#include //

2012-08-13 17:36:14 649

原创 [開發記錄] 編譯 BBxM 用的應用程式

記錄:#2 撰寫 Source Code 並使用make進行編輯 -TI的文件內的基本編輯方式,使用 Code Sourcery lite 進行編譯,在安裝DVSDK之前也會提示需安裝此工具。先建立 helloworld.c 檔案,(代碼就不在此列出,可參考DVSDK內說明文件),以及建立Makefile檔案,另外需要Rule.make,此處直接用DVSDK內建好的檔案,在

2012-08-10 13:00:42 871

原创 [開發記錄] BBxM 系統建立

記錄:#1 建立系統檔案 -使用TI的DVSDK建構基本的linux系統,一開始安裝DVSDK4.03版,安裝好後要先執行 ./setup.sh,設定一些相關環境,依照setup.sh的script所留下的訊息,直接進行make clean 以及make all,缺少相當多工具包,將會在中途報錯。在網路上查詢,找到angstrom的版本,須搭配TI的DVSDK4.01版本,

2012-08-10 11:57:23 505

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除