合成歌聲(synthetic singing voice) 回上一層

In all the singing-voice synthesis studies below, each Mandarin syllable has only one recording in the database. That is, pitch, duration, and amplitude must be adjusted simultaneously to meet the definition of a note while timbre must be kept consistent.

1a:哥、爸真偉大, 22KHz, 1,123KB,
1b:song1.mp3(singing voice, 22KHz, 204KB),
1c:兩隻老虎, 22KHz, 526KB,
1d:song2.mp3(singing voice, 22KHz, 96KB),
(2000) TIPW, a variant of PSOLA,
同一音源 合成 兩種音色,
共409個國語音節, 每一種音節只有一次發音,
迴音.
盛思豪
2a:小星星, 22KHz, 226KB,
2b:小星星, 抖音, 22KHz, 227KB,
2c:兩隻老虎, 22KHz, 139KB,
2d:兩隻老虎, 抖音, 22KHz, 139KB,
(2002)弦波模型 (Sinusoid Model),
共409個國語音節, 每一種音節只有一次發音,
陳 安璿
3a:小星星, 22KHz, 698KB,
3b:只要我長大, 22KHz, 273KB,
3c:用心良苦, 22KHz, 2,067KB,
(2004) 弦波模型(Sinusoid Model) 歌唱聲
(由我們程式合成人聲信號)
;
MIDI 即時、同步伴奏
(由作業系統合成樂器信號);
共409個國語音節, 每一種音節只有一次發音,
抖音(vibrato)、轉音(portamento)、氣音(breathy)
廖皇量
4a:青春舞曲(ADSR,PhaseSync),22KHz, 290KB;
4d:青春舞曲(X, X); 4e:青春舞曲(直接串接);

4f:康定情歌(ADSR,PhaseSync),22KHz, 302KB;
4i:康定情歌(X, X); 4j:康定情歌(直接串接);
(2006) 改進的諧波加噪音模型 (improved harmonic- plus- noise model)
duration control: Attack- Decay- Sustain- Release; Phase Synchronization
共409個國語音節, 每一種音節只有一次發音,
(1)轉音(port.), 抖音(vib.): 青春舞曲, 康定情歌
(2)轉音, 抖音, 迴音(revr.): 青春舞曲, 康定情歌
王如江
歌 聲表情(singing expression) 模仿,
(2007) 基於 歌聲表情 分析 與 單元選擇 之 國語歌聲 合成 研究
林正甫 small figure
使用 ANN 抖音 (vibrato) 參數 模型之 國語歌聲 合成,
(2008) 使用ANN抖音參數模型之國語歌聲 合成
抖音參數: 音調軌跡 (intonation), 抖音範圍 (vibrato extent), 抖音頻率(vibrato rate)
共409個 國語音節, 每一種音節 只有一次 發音
蔡哲彰
使用頻譜包絡內插之國語歌聲合成
(2010)
國語合成歌聲流暢度改進之研究 





荒 腔走板修理

1. two tigers
(1a)
original recorded syllables
(1b)
pitch and duration corrected (HNM)
(1c)
pitch and duration corrected (PV)

2. little stars
(2a)
original recorded syllables
(2b)
pitch and duration corrected (HNM)
(2c)
pitch and duration corrected (PV)

3. program demo
(3a)
兩隻老虎
(3b)轉音, HNM與PV比較
鳳尾草
(3c)迴音, 及音色轉變
蝴蝶
(3d)女生聲音, 及同步 MIDI  播放 鳳尾草