(1) |
在信號波形合成方面,使用先前提出的"時間比例基週波形內差法"(TIPW)。 |
(2) |
在韻律(prosodic)參數產生方面,主要的參數是音節
基週軌跡參數,使用先前研究國語語音合成建立的"句子基週軌跡隱藏式馬可夫模型"
(SPC-HMM),作句子基週軌跡的產生。 |
(3) |
關於音節長度、振幅兩參數,參考了前人的成果,再加以修改而訂出 產生規則。 |
(4) |
動態挑選之音節單元, 來自於 4*409*6=9816 個三連音節
的中間音節。我們依據聲學知識定義一種計算合成單元串接之頻譜差異距離的量測,
再依據發音知識訂定數個路徑行進之限制規則,然後使用動態規劃演算法,
以整句考量的方式,來挑選出一個最佳的合成單元序列。
|
(5) |
古鴻炎、王國憲、曹亦岑,「整合發音與聲學知識之國語合成語音流暢度改進之方法」,
2003人工智慧、模糊系統、及灰色系統聯合研討會,台北,(2003)。
Gu, Hung-Yan and Kuo-Hsian Wang,
"An Acoustic and Articulatory Knowledge Integrated Method for Improving
Synthetic Mandarin Speech's Fluency", 2004 International Symposium on
Chinese Spoken Language Processing, Hong Kong, pp. 205-208, (2004).
|