語音合成,又稱文語轉換技術,顧名思義就是將文字信息轉化為可聽的聲音信息,讓機器像人一樣開口說話,科大訊飛語音合成系統也是以先進的大語料庫和語音韻律描述體系為基礎,配上對任意文本、任意篇章閱讀的連續語音,就能合成音質可媲美真人發音的效果,軟件主要應用于小型、大型以及電信級的聲訊服務平臺企業呼叫中心、UMS和Voice Portal等新興語音服務,不僅能夠提供普通話、廣東話、英語等上十個常用語種,還包含了業界領先的中英混讀、粵英混讀和臺灣國語的功能,為各地用戶帶來了極大的方便。

全新的科大訊飛語音合成系統5.0和之前的產品相比在功能上有多方面的改進和提升,除了前面提到的多語種外,還增加了七個不同發音人錄音語料,增強了文本分析技術,保證了對文本中未登錄詞(如地名)、多音字、特殊符號(如標點、數字)、韻律短語等智能分析和處理,并提高了錄音質量,使得在聽感上得到了大大的改進,確保轉換的語音流暢、清晰、自然且賦有親和力,軟件還支持各種文本格式信息和各種語音格式數據的輸入,提供了標準接口、簡單接口、COM接口、SAPI接口等多種接口,便于在多種環境下使用系統。

軟件特色

1、應用于小型、大型以及電信級的聲訊服務平臺企業呼叫中心、UMS和Voice Portal等新興語音服務。

2、該系統具有高質量的語音合成效果;

3、全面完善的功能特性;

4、細致周到的優化方案。

5、該成果將得到廣泛應用。

科大訊飛語音合成系統5.0完整版安裝步驟

1、D盤新建文件夾A,并在A中建立兩個子文件夾1和2做為軟件的安裝目錄。

2、點擊科大5.0運行庫\Runtime Demo文件夾中的Runtime(Demo)_Chinese (PRC)。msi 進行安裝。

3、安裝到D盤所建的A文件夾中1文件夾目錄下。

4、安裝語音庫選一個語音庫,如雙擊XIAOYU文件夾里的setup.exe,自動安裝。

5、點擊InterPhonic5.0運行庫\ToolKit文件夾中的ToolKit_Chinese (PRC)。msi進行安裝。

6、安裝到D盤所建的A文件夾中2文件夾目錄下。

7、點選擇邦定文件位置為A文件夾中1文件夾目錄下的bin文件夾內的ttsknl.dll文件。

8、先別急著打開軟件。將1文件夾目錄下的bin文件夾中的iFlyTTSGUI.exe程序創建桌面快捷方式,再雙擊它打開程序。

9、這時出現會彈出一個配置合成引引擎窗口,選中BIN中的ttsknl.dll,最后點列出引擎就可以使用了。

科大訊飛語音合成系統5.0功能特性

1、高質量語音——將輸入文本實時轉換為流暢、清晰、自然和具有表現力的語音數據;

2、多語種服務——整合了多語種語音合成引擎,可提供中文、中英文混讀、英文、廣東話的語音合成服務;

3、高精度文本分析技術——保證了對文本中未登錄詞(如地名)、多音字、特殊符號(如標點、數字)、韻律短語等智能分析和處理;

4、多字符集支持——支持輸入GB2312、GBK、Big5、Unicode和UTF-8等多種字符集,普通文本和帶有CSSML標注等多種格式的文本信息;

5、多種數據輸出格式——支持輸出多種采用率的線性Wav,A/U率Wav和Vox等格式的語音數據;

6、靈活的接口——提供了標準接口、簡單接口、COM接口、SAPI接口,便于在多種環境下進行系統的集成;

7、語音調整功能——開發接口提供了音量、語速、音高等多種合成參數的動態調整功能;

8、配置和管理工具——合成引擎提供了統一進行配置和管理的工具,完成了全局參數配置、用戶詞典、用戶規則、定制資源包管理等功能;

9、效果優化——合成引擎提供了以定制資源包和CSSML為代表的多種針對實際應用環境進行合成效果優化的方法;

10、一致的訪問方式——能以Client/Server方式訪問遠程的語音合成服務,并且提供與本地調用相同的開發接口,實現了完全透明的訪問;

11、動態負載均衡——提供了動態負載均衡模塊,以對用戶透明的方式動態調配多臺語音合成服務器的資源;

12、背景音和預錄音——合成系統還提供了背景音和預錄音的功能 ,滿足用戶不同場合的應用和個性化需求。

科大訊飛語音合成系統(interphonic) 5.0下載-科大訊飛語音合成系統電腦版下載下載地址

遠程下載