創意無限
我有我天地
聲韻悠揚
從前,有三隻小豬
第二期 出版日:二零零四年二月
聲韻悠揚

資訊科技發展一日千里, 香港正在穩步轉型成一個先進的「資訊社會」,這亦正是政府「數碼21」資訊科技策略的目標。在此迅速的轉型過程之中,我們必須確保整個社會都能從資訊科技發展中受惠。這不單包括專業的科技人才, 亦需包括社會上各階層人士,如長者、殘障人士等。缺乏資訊科技知識的人士會愈來愈難在資訊主導的高科技社會上立足。社會上不同層面的人士在接觸資訊科技和應用互聯網的機會的差距,稱為「數碼隔膜」(Digital Divide)。我們必須將資訊科技普及化,消除「數碼隔膜」,共同締造一個「數碼共融」的 社會。蒙美玲教授在工程學院成立了人機通訊實驗室,以開發「最優化可用性的人機界面」技術為長遠的研究方針。此種界面的特性是「多語言、多模式、多媒 體」,目標在於支援任何人士,於任何地方,任何時間,以任何電子器材輕易地存取互聯網上實時的資訊。我們實驗室的研究小組,正積極地開發一系列的人機界面技術,包括語音合成,人機對話模型,語音識別等 等。以下為大家介紹當中一個重點研究項目﹕一個名為「悠揚」的廣東話語音合成系統。

語音合成技術,是把文字轉化成聲音,令電腦可以人聲讀出文字資訊。在英美,英語語音合成技術研究己發展了數十年,相比之下,廣東話語音合成的研究只是剛剛起步。而廣東話的一字多音以及複雜的九聲調,為這項只有短短數年的研究帶來不少挑戰。我們的廣東話語音合成系統之所以取名為「悠揚」,是由於它採用嶄新的方法,克服以上的難題,擺脫舊有合成語音生硬及機械化的缺點。「悠揚」懂得根據上文下理,合成正確、高自然度以及悠揚悅耳的廣東話語音。我們結合了「悠揚」及語言識別技術,開發了「語音瀏覽器」,支援視障人士透過電話講出指令,然後「悠揚」將網上的文字轉化成廣東話讀出,這樣他們便能用說話和耳朵「瀏覽」網上資訊。這語音瀏覽系統現已供香港失明人協進會試用。

蒙美玲教授(前排中)、筆者(後排中)及人機通訊實驗室的
研究小組之其他成員

除了支援視障的用戶,「悠揚」也能應用於我們的日常生活中。如中文大學「悠揚」語音天氣熱線 (CU Weather, Tel: 2603-7884),便是結合了「悠揚」、電話對話系統技術、以及從天文台網站自動攝取的實時天氣資料而成的天氣熱線。用戶可以透過電話收聽廿四小時不停自動更新的天氣資訊。再加一點創意,「悠揚」更能為我們的生活帶來無限的方便。蒙教授的一次親身體驗,為「悠揚」的應用帶到新的層面﹕一次準備接機,遇上嚴重的航班延誤,叫她整個上午頻密地致電航空公司詢問該航班的最新抵港時間,令工作繁忙的她煩惱不已。於是引發了她想出利用「悠揚」發展出「中文大學語音提示系統」(CU Voice Alert) 的構思。有了這個系統,我們現在可以透過網頁預先輸入提示項目(如航班抵港時間),提示水平 (如抵港前一小時),及電話號碼(如用戶的手機號碼),系統便會在提示水平到達時致電用戶,提醒用戶準備到機場接機。「悠揚」語音提示系統的應用層面廣泛,包括:股票、外幣實時報價,提醒長者預約時間等。

「悠揚」以語音媒體把資訊帶到社會各個階層,打破「數碼隔膜」,並且用途廣泛,為普羅市民的生活提供方便。筆者由學士畢業論文開始接觸廣東話語音合成技術,興趣驅使筆者在碩士論文中對這項技術作進一步研究,到現在成為此研究項目的主力工程師。從當初一個簡單的發聲示範系統,到現在得到「悠揚」這研究成果,並能吸引不少本地及海外的公司垂青,筆者感到此項研究工作十分有意義。該項技術尚有廣闊的研究空間,例如改良合成語音的節奏、語氣、感情等等。期待日新月異的科技能替這個技術帶來更多可能,為我們的生活模式打開更新的一頁。

(「悠揚」網址:http://www.se.cuhk.edu.hk/cuvocal

 

溤恬瑩 系統工程與工程管理學系研究項目工程師

上一篇   下一篇

©2003 CUHK News Network. All Rights Reserved.
Terms under which this service is provided to you.
Read our privacy guidelines. Contact us.