簡述:Web服務(wù)器語音發(fā)展變化大體指的就是從無聲到有聲的變化。目前,文本語音轉(zhuǎn)換器(TTS,TexttoSpeech)的研究工作已經(jīng)取得了很大的進(jìn)步,實(shí)現(xiàn)了自動(dòng)的語言分析理解,并允許TTS的使用者增加更多的
Web服務(wù)器語音發(fā)展變化大體指的就是從無聲到有聲的變化?! ?/P>
目前,文本語音轉(zhuǎn)換器(TTS,Text to Speech)的研究工作已經(jīng)取得了很大的進(jìn)步,實(shí)現(xiàn)了自動(dòng)的語言分析理解,并允許TTS的使用者增加更多的韻律、音調(diào)在講話中,使TTS系統(tǒng)的發(fā)聲更接近人聲。在自動(dòng)語音識(shí)別系統(tǒng)(ASR)領(lǐng)域里,自動(dòng)語音識(shí)別系統(tǒng)在從整個(gè)詞的模仿匹配,向音素層次的識(shí)別系統(tǒng)方向發(fā)展。自動(dòng)語音識(shí)別系統(tǒng)的詞匯表由一個(gè)基于聲音片斷的字母表構(gòu)成,而且這種詞匯表是受不同語言限制的?;谶@種方式,在一個(gè)寬廣的聲音行列里,講話能被識(shí)別系統(tǒng)發(fā)現(xiàn)和挑揀出來,并加以識(shí)別。并且,在識(shí)別一個(gè)詞的時(shí)候,每一個(gè)音素將從系統(tǒng)的輸入中挑揀出來,拼接組合后與已經(jīng)有的音素和詞語模板進(jìn)行比較,來產(chǎn)生需要的模板。音素的識(shí)別大大減輕了ASR對(duì)講話者的依賴性,并且使得它非常容易去建立大型的和容易修改的語音識(shí)別字典,從而滿足不同應(yīng)用市場的需求。
Web語音發(fā)展的另一方面是VoiceXML(Voice Extensible Markup Language-語音可擴(kuò)展標(biāo)記語言)的進(jìn)展。VoiceXML的主要目標(biāo)是要將Web上已有的大量應(yīng)用、豐富的內(nèi)容,讓交互式語音界面也能夠全部享受。Web服務(wù)器處理一個(gè)來自客戶端應(yīng)用的請(qǐng)求,這一請(qǐng)求經(jīng)過了VoiceXML解釋程序和VoiceXML解釋程序語境處理,作為響應(yīng),服務(wù)器產(chǎn)生出VoiceXML文件,在回復(fù)當(dāng)中,要經(jīng)過VoiceXML解釋程序的處理。VoiceXML 1.0規(guī)范基于XML,為語音和電話應(yīng)用的開發(fā)者、服務(wù)提供商和設(shè)備制造商提供了一個(gè)智能化的API。VoiceXML的標(biāo)準(zhǔn)化將簡化Web上具有語音響應(yīng)服務(wù)的個(gè)性化界面的創(chuàng)建,使人們能夠通過語音和電話訪問網(wǎng)站上的信息和服務(wù),像今天通過CGI腳本一樣檢索中心數(shù)據(jù)庫,訪問企業(yè)內(nèi)部網(wǎng),制造新的語音訪問設(shè)備。VoiceXML的執(zhí)行平臺(tái)上面加載了相應(yīng)的軟件和硬件,例如,ASR、TTS,從而實(shí)現(xiàn)語音的識(shí)別以及文本和語音之間的轉(zhuǎn)化。
目前,IBM、Nokia、Lucent、Motorola等著名廠商都已經(jīng)開發(fā)出相應(yīng)支持VoiceXML的產(chǎn)品,但現(xiàn)在的ASR和TTS系統(tǒng)大多還不能支持中文。
搜索詞
熱門產(chǎn)品推薦