簡述:
Web服務(wù)器語音發(fā)展變化大體指的就是從無聲到有聲的變化?! ?/P>
目前,文本語音轉(zhuǎn)換器(TTS,Text to Speech)的研究工作已經(jīng)取得了很大的進步,實現(xiàn)了自動的語言分析理解,并允許TTS的使用者增加更多的韻律、音調(diào)在講話中,使TTS系統(tǒng)的發(fā)聲更接近人聲。在自動語音識別系統(tǒng)(ASR)領(lǐng)域里,自動語音識別系統(tǒng)在從整個詞的模仿匹配,向音素層次的識別系統(tǒng)方向發(fā)展。自動語音識別系統(tǒng)的詞匯表由一個基于聲音片斷的字母表構(gòu)成,而且這種詞匯表是受不同語言限制的。基于這種方式,在一個寬廣的聲音行列里,講話能被識別系統(tǒng)發(fā)現(xiàn)和挑揀出來,并加以識別。并且,在識別一個詞的時候,每一個音素將從系統(tǒng)的輸入中挑揀出來,拼接組合后與已經(jīng)有的音素和詞語模板進行比較,來產(chǎn)生需要的模板。音素的識別大大減輕了ASR對講話者的依賴性,并且使得它非常容易去建立大型的和容易修改的語音識別字典,從而滿足不同應(yīng)用市場的需求。
Web語音發(fā)展的另一方面是VoiceXML(Voice Extensible Markup Language-語音可擴展標記語言)的進展。VoiceXML的主要目標是要將Web上已有的大量應(yīng)用、豐富的內(nèi)容,讓交互式語音界面也能夠全部享受。Web服務(wù)器處理一個來自客戶端應(yīng)用的請求,這一請求經(jīng)過了VoiceXML解釋程序和VoiceXML解釋程序語境處理,作為響應(yīng),服務(wù)器產(chǎn)生出VoiceXML文件,在回復(fù)當(dāng)中,要經(jīng)過VoiceXML解釋程序的處理。VoiceXML 1.0規(guī)范基于XML,為語音和電話應(yīng)用的開發(fā)者、服務(wù)提供商和設(shè)備制造商提供了一個智能化的API。VoiceXML的標準化將簡化Web上具有語音響應(yīng)服務(wù)的個性化界面的創(chuàng)建,使人們能夠通過語音和電話訪問網(wǎng)站上的信息和服務(wù),像今天通過CGI腳本一樣檢索中心數(shù)據(jù)庫,訪問企業(yè)內(nèi)部網(wǎng),制造新的語音訪問設(shè)備。VoiceXML的執(zhí)行平臺上面加載了相應(yīng)的軟件和硬件,例如,ASR、TTS,從而實現(xiàn)語音的識別以及文本和語音之間的轉(zhuǎn)化。
目前,IBM、Nokia、Lucent、Motorola等著名廠商都已經(jīng)開發(fā)出相應(yīng)支持VoiceXML的產(chǎn)品,但現(xiàn)在的ASR和TTS系統(tǒng)大多還不能支持中文。
本文由專業(yè)服務(wù)器托管——騰佑科技提供,推薦服務(wù)網(wǎng)通服務(wù)器租用
騰佑科技(www.mubashirfilms.com)成立于2009年,總部位于河南鄭州,是一家集互聯(lián)網(wǎng)基礎(chǔ)設(shè)施及軟硬件于一體化的高新技術(shù)企業(yè),具有IDC/ISP/ICP/云牌照、雙軟等資質(zhì),并擁有多個國家版權(quán)局認證。公司自成立以來,一直致力于發(fā)展互聯(lián)網(wǎng)IDC數(shù)據(jù)中心DataCenter、云計算Cloud、大數(shù)據(jù)BigDate、人工智能AI、內(nèi)容加速CDN、互聯(lián)網(wǎng)安全、軟件定制開發(fā)等產(chǎn)品服務(wù)及行業(yè)客戶技術(shù)一體化智能解決方案;2018年成為百度智能云AI河南服務(wù)中心。
售前咨詢熱線:400-996-8756
備案提交:0371-89913068
售后客服:0371-89913000
搜索詞
熱門產(chǎn)品推薦