Web服務(wù)器語音發(fā)展變化

發(fā)布時間：2012-03-06 作者：admin

分享到： QQ空間新浪微博騰訊微博人人網(wǎng) 微信

簡述：Web服務(wù)器語音發(fā)展變化大體指的就是從無聲到有聲的變化。目前，文本語音轉(zhuǎn)換器（TTS，TexttoSpeech）的研究工作已經(jīng)取得了很大的進步，實現(xiàn)了自動的語言分析理解，并允許TTS的使用者增加更多的

Web服務(wù)器語音發(fā)展變化大體指的就是從無聲到有聲的變化?！　?/P>

目前，文本語音轉(zhuǎn)換器（TTS，Text to Speech）的研究工作已經(jīng)取得了很大的進步，實現(xiàn)了自動的語言分析理解，并允許TTS的使用者增加更多的韻律、音調(diào)在講話中，使TTS系統(tǒng)的發(fā)聲更接近人聲。在自動語音識別系統(tǒng)（ASR）領(lǐng)域里，自動語音識別系統(tǒng)在從整個詞的模仿匹配，向音素層次的識別系統(tǒng)方向發(fā)展。自動語音識別系統(tǒng)的詞匯表由一個基于聲音片斷的字母表構(gòu)成，而且這種詞匯表是受不同語言限制的?；谶@種方式，在一個寬廣的聲音行列里，講話能被識別系統(tǒng)發(fā)現(xiàn)和挑揀出來，并加以識別。并且，在識別一個詞的時候，每一個音素將從系統(tǒng)的輸入中挑揀出來，拼接組合后與已經(jīng)有的音素和詞語模板進行比較，來產(chǎn)生需要的模板。音素的識別大大減輕了ASR對講話者的依賴性，并且使得它非常容易去建立大型的和容易修改的語音識別字典，從而滿足不同應(yīng)用市場的需求。

Web語音發(fā)展的另一方面是VoiceXML（Voice Extensible Markup Language-語音可擴展標記語言）的進展。VoiceXML的主要目標是要將Web上已有的大量應(yīng)用、豐富的內(nèi)容，讓交互式語音界面也能夠全部享受。Web服務(wù)器處理一個來自客戶端應(yīng)用的請求，這一請求經(jīng)過了VoiceXML解釋程序和VoiceXML解釋程序語境處理，作為響應(yīng)，服務(wù)器產(chǎn)生出VoiceXML文件，在回復(fù)當中，要經(jīng)過VoiceXML解釋程序的處理。VoiceXML 1.0規(guī)范基于XML，為語音和電話應(yīng)用的開發(fā)者、服務(wù)提供商和設(shè)備制造商提供了一個智能化的API。VoiceXML的標準化將簡化Web上具有語音響應(yīng)服務(wù)的個性化界面的創(chuàng)建，使人們能夠通過語音和電話訪問網(wǎng)站上的信息和服務(wù)，像今天通過CGI腳本一樣檢索中心數(shù)據(jù)庫，訪問企業(yè)內(nèi)部網(wǎng)，制造新的語音訪問設(shè)備。VoiceXML的執(zhí)行平臺上面加載了相應(yīng)的軟件和硬件，例如，ASR、TTS，從而實現(xiàn)語音的識別以及文本和語音之間的轉(zhuǎn)化。

目前，IBM、Nokia、Lucent、Motorola等著名廠商都已經(jīng)開發(fā)出相應(yīng)支持VoiceXML的產(chǎn)品，但現(xiàn)在的ASR和TTS系統(tǒng)大多還不能支持中文。

本文由專業(yè)服務(wù)器托管——騰佑科技提供，推薦服務(wù)網(wǎng)通服務(wù)器租用

點擊展開全文

鄭州騰佑科技有限公司(以下簡稱“騰佑科技”)成立于2009年，總部位于鄭州，是一家致力于互聯(lián)網(wǎng)服務(wù)業(yè)的高新技術(shù)企業(yè)，公司主營業(yè)務(wù)以互聯(lián)網(wǎng)數(shù)據(jù)中心、云計算、人工智能、軟件開發(fā)、安全服務(wù)“互聯(lián)網(wǎng)+”行業(yè)解決方案及行業(yè)應(yīng)用等相關(guān)業(yè)務(wù)。

售前咨詢熱線：400-996-8756

備案提交：0371-89913068

售后客服：0371-89913000