中國(guó)是全球玩具生產(chǎn)大國(guó),世界玩具產(chǎn)品總量的80%以上都是在中國(guó)制造。不過(guò),有數(shù)據(jù)顯示2005年中國(guó)出口傳統(tǒng)玩具的增幅微弱,尤其是科技含量較低的毛絨、塑料等類型的玩具,由于利潤(rùn)空間小、受歡迎程度低,已經(jīng)很難在市場(chǎng)上占據(jù)更多的份額。
很長(zhǎng)一段時(shí)間內(nèi),玩具產(chǎn)品將保持兩大發(fā)展趨勢(shì):一是益智、創(chuàng)新的玩具,包括電子、機(jī)械類玩具;另一方面,智能玩具方興未艾,智能化、人性化并具備圖文識(shí)別、語(yǔ)音識(shí)別、傳感器等技術(shù)的產(chǎn)品會(huì)大受歡迎。信息產(chǎn)業(yè)部在《2006年電子信息產(chǎn)業(yè)發(fā)展基金項(xiàng)目指南》中,將“多媒體益智娛樂(lè)產(chǎn)品”作為一項(xiàng)國(guó)家支持的產(chǎn)業(yè)化項(xiàng)目,也說(shuō)明了玩具產(chǎn)品的市場(chǎng)動(dòng)向。
將人工智能引入玩具產(chǎn)品設(shè)計(jì),使玩具具有人機(jī)交互的能力;而通過(guò)互聯(lián)網(wǎng)技術(shù),在線可更新的劇本使得創(chuàng)意保持一定的新鮮感,并可根據(jù)用戶的需求進(jìn)行定制。這種全新的玩具設(shè)計(jì)方案將會(huì)是玩具業(yè)在技術(shù)上的又一次飛躍,使得寓教于樂(lè)成為可能。
北京凌聲芯語(yǔ)音科技有限公司根據(jù)當(dāng)前玩具產(chǎn)品的業(yè)界動(dòng)向,針對(duì)傳統(tǒng)玩具和語(yǔ)音科技、娛樂(lè)元素和益智教育、傳統(tǒng)玩具和互聯(lián)網(wǎng)這三方面,結(jié)合設(shè)計(jì)開發(fā)了新型的智能玩具開發(fā)系統(tǒng)。該系統(tǒng)在硬件上基于清華大學(xué)和英飛凌公司共同設(shè)計(jì)開發(fā)的低成本、低功耗語(yǔ)音處理專用芯片UniLite(凌聲芯公司在UniLite上實(shí)現(xiàn)了低碼率、高品質(zhì)的語(yǔ)音編解碼算法,特定人/非特定人語(yǔ)音識(shí)別算法)。
此外為實(shí)現(xiàn)智能玩具的劇本創(chuàng)意,我們還設(shè)計(jì)了劇本轉(zhuǎn)換軟件ITADL,可以將不同創(chuàng)意的劇本快捷方便地轉(zhuǎn)換成映射文件下載到硬件中去。凌聲芯公司在智能玩具領(lǐng)域,能夠從底層的硬件結(jié)構(gòu)、語(yǔ)音處理算法和頂層的玩具開發(fā)系統(tǒng)提供技術(shù)支持,具體結(jié)構(gòu)如圖1所示。
UniLite芯片簡(jiǎn)介
UniLite是一款用于語(yǔ)音處理的專用芯片,芯片采用高集成度的SoC系統(tǒng)結(jié)構(gòu)以0.18um半導(dǎo)體工藝制造,以16位定點(diǎn)DSP(104MIPS)為核心,片內(nèi)集成了直接雙訪問(wèn)快速SRAM、ADC/DAC(有效精度為12位)、多種通信接口和通用GPIO等設(shè)備,外部只需擴(kuò)展閃存、電源芯片、啟動(dòng)芯片等少量芯片即可構(gòu)成完整的系統(tǒng)應(yīng)用。UniLite芯片使用TQFP6?封裝,同時(shí)采用了低功耗設(shè)計(jì)技術(shù),非常適合應(yīng)用到采用干電池/鋰電池供電的移動(dòng)設(shè)備中。使用UniLite芯片構(gòu)成智能玩具中的語(yǔ)音處理系統(tǒng),只需要增加很少的外圍器件,不再需要增加編解碼器,可以有效的減少產(chǎn)品成本。
語(yǔ)音識(shí)別技術(shù)
語(yǔ)音是人類最自然、最方便的交互形式,如果玩具能夠聽(tīng)懂人說(shuō)的話,那么人和玩具之間就能夠產(chǎn)生很豐富的交流,這樣的玩具更能夠吸引人的注意力,贏得用戶的歡迎。凌聲芯公司推出的智能玩具設(shè)計(jì)方案采用語(yǔ)音技術(shù)實(shí)現(xiàn)人機(jī)交互。
目前市場(chǎng)上已有一些具有語(yǔ)音識(shí)別功能的玩具,鑒于成本原因,大都采用特定人語(yǔ)音識(shí)別技術(shù),識(shí)別詞條少、更新詞表需要再訓(xùn)練,使用很不方便。而凌聲芯公司的智能玩具開發(fā)系統(tǒng)采用基于子詞的非特定人語(yǔ)音識(shí)別算法。該算法的主要優(yōu)點(diǎn)在于:
1. 統(tǒng)性能穩(wěn)定,在較大規(guī)模識(shí)別任務(wù)下系統(tǒng)具有較高識(shí)別率,而且在噪聲環(huán)境下仍能保持較高的識(shí)別率。
2. 特別適合中文普通話的識(shí)別任務(wù),為當(dāng)前語(yǔ)音識(shí)別的主流技術(shù),其使用者可以是男性、女性,不同的年齡層次,甚至帶有地方口音的普通話都可以很好地識(shí)別出來(lái)。
3. 模型參數(shù)的規(guī)模不隨識(shí)別任務(wù)的變化而變化,可通過(guò)音素拼接的方式得到識(shí)別詞表中各詞條的識(shí)別模板。
4. 目前的硬件處理能力已經(jīng)可以達(dá)到識(shí)別200詞條語(yǔ)音命令,并在200詞以內(nèi)都能夠達(dá)到很高的識(shí)別率。
5. 修改識(shí)別任務(wù)時(shí)不需要任何訓(xùn)練,只要將識(shí)別詞條以GB2312/GBK(包含繁體)/Unicode/漢語(yǔ)拼音等任意的形式下載到硬件中去,即可進(jìn)行識(shí)別。
![](http://www.eet-china.com/ARTICLES/2006NOV/B/0611B_COD2_F1.jpg)
圖1:凌聲芯公司提供智能玩具開發(fā)技術(shù)支持
統(tǒng)計(jì)不同規(guī)模詞表識(shí)別任務(wù)下的識(shí)別率,如表1所示。
![](http://www.eet-china.com/ARTICLES/2006NOV/B/0611B_COD2_T1.jpg)
表1:不同詞表規(guī)模下系統(tǒng)的識(shí)別性能
在200詞以內(nèi),其識(shí)別率都達(dá)到了98%以上,而且識(shí)別的速度非?,200詞識(shí)別集系統(tǒng)的響應(yīng)時(shí)間是0.086倍實(shí)時(shí),即一句話說(shuō)完之后,只需要花費(fèi)講這句話的時(shí)間的0.086倍就可以得到識(shí)別結(jié)果,使用時(shí)幾乎感覺(jué)不到等待時(shí)間。
這種基于子詞的非特定人語(yǔ)音識(shí)別技術(shù)為智能玩具實(shí)現(xiàn)復(fù)雜功能、保持識(shí)別性能、網(wǎng)絡(luò)下載等提供了可靠的技術(shù)保證。
劇本創(chuàng)意實(shí)現(xiàn)
在硬件系統(tǒng)和嵌入式語(yǔ)音技術(shù)的基礎(chǔ)上,凌聲芯提供了ITDAL玩具開發(fā)系統(tǒng),該系統(tǒng)包括腳本編寫、腳本編譯、腳本仿真、腳本執(zhí)行幾個(gè)過(guò)程。ITDAL軟件可以方便快捷地實(shí)現(xiàn)一個(gè)玩具劇本,將文本形式的劇本創(chuàng)意實(shí)現(xiàn)并下載到硬件中。這里的劇本內(nèi)容可以包括文化、歷史、地理知識(shí);可以包括童話、兒歌、唐詩(shī)宋詞等等。
圖2給出了一個(gè)智能玩具劇本的實(shí)例。
![](http://www.eet-china.com/ARTICLES/2006NOV/B/0611B_COD2_F2.jpg)
圖2:智能玩具的劇本實(shí)例
玩具根據(jù)劇本的要求可以先提出一個(gè)問(wèn)題:“你好,問(wèn)你一個(gè)問(wèn)題,請(qǐng)問(wèn)道家學(xué)派的創(chuàng)始人是老子還是孔子?”。劇本的設(shè)計(jì)者必須將用戶所有可能的回答事先考慮到,并且對(duì)應(yīng)每個(gè)回答設(shè)計(jì)玩具的進(jìn)一步應(yīng)答,例如在上面提到的劇本中,用戶可能的回答除了包括“孔子”、“老子”這兩個(gè)回答外,另外可能的答案包括“曾子/孟子/不會(huì)/我不會(huì)/不知道/我不知道/我不明白/不玩了/再見(jiàn)”等其它答案。玩具根據(jù)用戶的回答,做出回應(yīng)。
目前該系統(tǒng)支持的劇本是玩具主導(dǎo)整個(gè)流程,還不能夠支持由用戶發(fā)問(wèn)的形式,因?yàn)榭紤]到嵌入式芯片的運(yùn)算能力,還不能支持開放集合的語(yǔ)音識(shí)別,只能支持到有限集合的語(yǔ)音識(shí)別。對(duì)于上面提到的語(yǔ)音識(shí)別劇本實(shí)例,用戶可能的回答形成的整個(gè)集合作為識(shí)別集。如果用戶作出的回答不在事先設(shè)定的集合內(nèi),系統(tǒng)就會(huì)將用戶的回答誤識(shí)別成集合內(nèi)的某個(gè)詞,因此在劇本設(shè)計(jì)時(shí),對(duì)每個(gè)問(wèn)題的識(shí)別集,需要考慮用戶所有可能的回答。
智能玩具開發(fā)系統(tǒng)
在凌聲芯的智能玩具系統(tǒng)中,玩具的提問(wèn)和玩具的應(yīng)答采用的是語(yǔ)音壓縮編解碼技術(shù),用戶回答玩具的提問(wèn)后使用的是非特定人語(yǔ)音識(shí)別技術(shù)。這樣的三個(gè)步驟在ITDAL中看作一個(gè)劇本節(jié)點(diǎn),一個(gè)完整的劇本包括多個(gè)這樣的劇本節(jié)點(diǎn)。ITDAL將劇本節(jié)點(diǎn)中的玩具提示音、用戶可能的回答集合、對(duì)于每個(gè)回答的應(yīng)答進(jìn)行重新腳本釋義,并經(jīng)過(guò)編譯仿真,即可生成最終的映射文件下載到玩具中。
該系統(tǒng)在硬件上還實(shí)現(xiàn)了從PC機(jī)的下載功能,可以實(shí)現(xiàn)“數(shù)據(jù)庫(kù)網(wǎng)站”到玩具終端的劇本更新,大大地提高了玩具的新穎性,同時(shí)在娛樂(lè)性的基礎(chǔ)上增加教育益智的功能。
圖3是智能玩具開發(fā)系統(tǒng)的劇本創(chuàng)意到下載的流程示意圖。
![](http://www.eet-china.com/ARTICLES/2006NOV/B/0611B_COD2_F3.jpg)
圖3:智能玩具開發(fā)系統(tǒng)流程圖
對(duì)于一個(gè)設(shè)計(jì)好的劇本創(chuàng)意,根據(jù)其內(nèi)容,錄制玩具的發(fā)音(提示音),同時(shí)準(zhǔn)備識(shí)別詞表。然后在PC機(jī)上根據(jù)ITDAL系統(tǒng)將劇本進(jìn)行編輯處理,結(jié)合提示音文件生成最終的映射文件。將準(zhǔn)備好的映射文件通過(guò)USB口下載到玩具終端,劇本的實(shí)現(xiàn)工作就完成了。
對(duì)于這樣一個(gè)可以提供劇本下載更新的玩具,推出市場(chǎng)的同時(shí)需要提供一個(gè)數(shù)據(jù)庫(kù)網(wǎng)站的支持,該網(wǎng)站提供各種玩具創(chuàng)意的映射文件下載,用戶購(gòu)買一個(gè)玩具之后,如果對(duì)其創(chuàng)意感到厭倦,就可以到網(wǎng)站下載新的創(chuàng)意,保持玩具持續(xù)的新鮮感。此外,用戶還可以根據(jù)自身需要在網(wǎng)站上定制自己的個(gè)性化玩具。 |