❶ 如何在MATLAB里使用HTK
voicebox :語音處理工具箱的MATLAB
導言
voicebox是一個語音處理工具箱包括MATLAB的套路是保持的,而且大部分寫的邁克布魯克斯系,電機及電子工程,帝國學院,展覽路,倫敦sw7 2bt ,英國。幾個常式需要MATLAB的V5的。
該常式,可作為壓縮tar文件或者作為一個ZIP檔案,並提供了根據合同條款在GNU公共許可證。
請發送任何意見,建議,錯誤報告等,以mike.brookes @ ic.ac.uk.
目錄
音頻文件輸入/輸出
閱讀和書寫WAV和其他語音文件格式
頻率表
轉換之間的赫茲,梅爾,雇員再培訓局和MIDI頻率表
傅立葉/ DCT變換/ Hartley變換
各類相關變換
隨機數生成
產生隨機向量與雜訊信號
向量距離
計算之間的距離向量名單
語音分析
活躍水平估計,在光譜圖
的LPC分析的講話
線性預測編碼常式
語音合成
聲門波形模式
語音增強
譜雜訊減法
語音編碼
PCM編碼,矢量量化
語音識別
前端處理認可
實用功能
雜項實用功能
音頻文件輸入/輸出
常式可供閱讀,並在某些情況下,寫信,各種文件格式:
讀寫後綴
readwav writewav 。 WAV等,這些常式允許任意數量的渠道,也能對付線性的PCM (任何精度高達32位) ,律PCM和木法的PCM 。大型文件,可以讀,寫在小大塊。
問題補充: readhtk writehtk 。 HTK液讀寫波形文件所用熵的隱馬爾可夫工具箱。
readsfs 。自力更生支援講話備案系統檔案,由馬克huckvale在UCL的。
readsph 。 NIST的手機領域中的格式文件(包括timit ) 。
readaif 。 AIF的音頻交換文件格式所使用的Mac用戶。
頻率大規模改建
該梅爾表是基於人類感知的正弦波足球場。該常式mel2frq和frq2mel轉換之間的這種規模和頻率在Hz的。
雇員再培訓局,規模化,是基於等價矩形帶寬的人耳。該常式erb2frq和frq2erb轉換之間的利率再培訓局的規模和頻率赫茲。
使用MIDI標准,還明確規定了編號的半音中c正60 。該常式frq2midi和midi2frq間進行轉換,這音樂頻率規模和赫茲。 frq2midi會除了輸出注意到在名稱中字元格式。 midi2frq可以使用一般同等規模的鍛煉,否則畢達哥拉斯規模只是音調。
❷ 求 voice box 文件 做語音識別用的
voicebox :語音處理工具箱的MATLAB
導言
voicebox是一個語音處理工具箱包括MATLAB的套路是保持的,而且大部分寫的邁克布魯克斯系,電機及電子工程,帝國學院,展覽路,倫敦sw7 2bt ,英國。幾個常式需要MATLAB的V5的。
該常式,可作為壓縮tar文件或者作為一個ZIP檔案,並提供了根據合同條款在GNU公共許可證。
請發送任何意見,建議,錯誤報告等,以mike.brookes @ ic.ac.uk.
目錄
音頻文件輸入/輸出
閱讀和書寫WAV和其他語音文件格式
頻率表
轉換之間的赫茲,梅爾,雇員再培訓局和MIDI頻率表
傅立葉/ DCT變換/ Hartley變換
各類相關變換
隨機數生成
產生隨機向量與雜訊信號
向量距離
計算之間的距離向量名單
語音分析
活躍水平估計,在光譜圖
的LPC分析的講話
線性預測編碼常式
語音合成
聲門波形模式
語音增強
譜雜訊減法
語音編碼
PCM編碼,矢量量化
語音識別
前端處理認可
實用功能
雜項實用功能
音頻文件輸入/輸出
常式可供閱讀,並在某些情況下,寫信,各種文件格式:
讀寫後綴
readwav writewav 。 WAV等,這些常式允許任意數量的渠道,也能對付線性的PCM (任何精度高達32位) ,律PCM和木法的PCM 。大型文件,可以讀,寫在小大塊。
問題補充: readhtk writehtk 。 HTK液讀寫波形文件所用熵的隱馬爾可夫工具箱。
readsfs 。自力更生支援講話備案系統檔案,由馬克huckvale在UCL的。
readsph 。 NIST的手機領域中的格式文件(包括timit ) 。
readaif 。 AIF的音頻交換文件格式所使用的Mac用戶。
頻率大規模改建
該梅爾表是基於人類感知的正弦波足球場。該常式mel2frq和frq2mel轉換之間的這種規模和頻率在Hz的。
雇員再培訓局,規模化,是基於等價矩形帶寬的人耳。該常式erb2frq和frq2erb轉換之間的利率再培訓局的規模和頻率赫茲。
使用MIDI標准,還明確規定了編號的半音中c正60 。該常式frq2midi和midi2frq間進行轉換,這音樂頻率規模和赫茲。 frq2midi會除了輸出注意到在名稱中字元格式。 midi2frq可以使用一般同等規模的鍛煉,否則畢達哥拉斯規模只是音調。
❸ Python中有沒有類似Matlab中VoiceBox的語音處理工具箱
有的,如下:
1. 解壓voicebox.zip,將整個目錄voicebox復制到MATLAB的安裝目錄下:
D:\MATLAB\R2012b\toolbox
2. 打開MATLAB,在版MATLAB命令窗口中輸入權命令:
>>cd D:\MATLAB\R2012b\toolbox
3. 將TOOLBOX下新加的voicebox工具箱加到MATLAB的搜索路徑中去。
添加voicebox工具箱的MATLAB的搜索路徑也可採用如下指令
>> addpath(genpath(' D:\MATLAB\R2012b\toolbox\voicebox'))
或者
>>path(' D:\MATLAB\R2012b\toolbox\voicebox',path)
4. 檢驗是否成功設置的方法:
在命令窗口中輸入以下命令:
which activlev.m(可以為所加工具箱的任一個M文件名稱),如果顯示正確,就說明上面的設置成功。
>> which activlev.m
D:\MATLAB\R2012b\toolbox\voicebox\activlev.m
註:這種方法貌似每次重啟MATLAB之後都要添加路徑,否則會找不到
❹ 我想做一個基於MATLAB的智能語音系統,怎樣在MATLAB GUI界面里弄一個錄音功能
利用matlab的音頻信號處理工具箱,可以實現聲音的錄制和播放。
錄音函數wavrecord語法為:
y=wavrecord(n,fs,channel,dataType);
其中
n為采樣點數,fs為采樣頻率,channel(通常取1或者2)為錄音通道數,dataType(例如double,single,int16,uint8)是采樣點的數據類型。
例子:
fs=16000; %取樣頻率
ration=2; %錄音時間
fprintf('Press any key to start %g seconds of recording...\n',ration);
pause;
fprintf('Recording...\n');
y=wavrecord(ration*fs,fs); %ration*fs 是總的采樣點數
fprintf('Finished recording.\n');
fprintf('Press any key to play the recording...\n');
pause;
wavplay(y,fs);
將上述代碼保存為record01.m文件,在matlab命令行下輸入剛才保存的文件名即可。
運行結果如下圖:
❺ matlab之語音處理與合成工具箱有沒有中文版本
你可以試試這個語音合成助手,不懂版可以看權這個http://jingyan..com/article/e9fb46e1606b6a7521f76699.html
❻ MATLAB工具箱有哪些作用
MATLAB附帶了很多工具箱(Toolbox),而且每次發布新版本時,工具箱幾乎都要增加版。按F1鍵打開MATLAB的「權Help」,在窗口左邊顯示了MATLAB所有的工具箱。
一般來說,每個工具箱針對一個具體的問題,如圖像處理工具箱(Image.Processing.Toolbox)專門針對數字圖像處理問題,偏微分方程工具箱(Partial.Differential.Equation.Toolbox)是偏微分方程(組)求解函數的集合。一個工具箱中包含若干函數。實際上,工具箱也是一個函數庫,在功能方面與MATLAB主體中的數值計算和數據可視化部分相同。
但有一點區別:主體部分的核心函數都是內置函數,是用C語言編寫並編譯過的;而工具箱中的函數都是基於MATLAB的二次開發,即用MATLAB語言寫的.m文件。用Editor打開這些文件,就可以看到源代碼。
❼ 如何使用matlab中的工具箱
上面的最優答案廢話有點多,我補充一個簡潔版答案:
一、自帶工具箱:
直接使用。都在toolbox文件夾內,而且默認早已設定完畢。
二、非自帶工具箱:
按照這個步驟:
1)下載並解壓;
2)復制到matlab安裝目錄下的toolbox文件夾內(當然也可以放到別處~);
3)在matlab的菜單:file-set path中,添加路徑,要求是連同子文件夾一同添加,路徑就是剛才你放置文件夾的地方。設定好了記得save。
4)完畢!