合成歌聲(Synthetic song)

合成歌聲(synthetic singing voice)

回上一層

In all the singing-voice synthesis studies below, each Mandarin syllable has only one recording in the database. That is, pitch, duration, and amplitude must be adjusted simultaneously to meet the definition of a note while timbre must be kept consistent.

1a:哥、爸真偉大, 22KHz, 1,123KB,
1b:song1.mp3(singing voice, 22KHz, 204KB),
1c:兩隻老虎, 22KHz, 526KB,
1d:song2.mp3(singing voice, 22KHz, 96KB), (2000) TIPW, a variant of PSOLA,
同一音源合成兩種音色,
共409個國語音節, 每一種音節只有一次發音,
迴音.

盛思豪
2a:小星星, 22KHz, 226KB,
2b:小星星, 抖音, 22KHz, 227KB,
2c:兩隻老虎, 22KHz, 139KB,
2d:兩隻老虎, 抖音, 22KHz, 139KB, (2002)弦波模型 (Sinusoid Model),
共409個國語音節, 每一種音節只有一次發音,

陳安璿
3a:小星星, 22KHz, 698KB,
3b:只要我長大, 22KHz, 273KB,
3c:用心良苦, 22KHz, 2,067KB, (2004) 弦波模型(Sinusoid Model) 歌唱聲
(由我們程式合成人聲信號);
MIDI 即時、同步伴奏
(由作業系統合成樂器信號);
共409個國語音節, 每一種音節只有一次發音,
抖音(vibrato)、轉音(portamento)、氣音(breathy)

廖皇量
4a:青春舞曲(ADSR,PhaseSync),22KHz, 290KB;
4d:青春舞曲(X, X); 4e:青春舞曲(直接串接);

4f:康定情歌(ADSR,PhaseSync),22KHz, 302KB;
4i:康定情歌(X, X); 4j:康定情歌(直接串接);
(2006) 改進的諧波加噪音模型 (improved harmonic- plus- noise model)
duration control: Attack- Decay- Sustain- Release; Phase Synchronization
共409個國語音節, 每一種音節只有一次發音,
(1)轉音(port.), 抖音(vib.): 青春舞曲, 康定情歌
(2)轉音, 抖音, 迴音(revr.): 青春舞曲, 康定情歌

王如江
歌聲表情(singing expression) 模仿,
(2007) 基於歌聲表情分析與單元選擇之國語歌聲合成研究

林正甫
使用 ANN 抖音 (vibrato) 參數模型之國語歌聲合成,
(2008) 使用ANN抖音參數模型之國語歌聲合成
抖音參數: 音調軌跡 (intonation), 抖音範圍 (vibrato extent), 抖音頻率(vibrato rate)
共409個國語音節, 每一種音節只有一次發音

蔡哲彰
使用頻譜包絡內插之國語歌聲合成 (2010)
國語合成歌聲流暢度改進之研究

荒腔走板修理

1. two tigers

(1a)	original recorded syllables
(1b)	pitch and duration corrected (HNM)
(1c)	pitch and duration corrected (PV)

2. little stars

(2a)	original recorded syllables
(2b)	pitch and duration corrected (HNM)
(2c)	pitch and duration corrected (PV)

3. program demo

(3a)	兩隻老虎
(3b)轉音, HNM與PV比較	鳳尾草
(3c)迴音, 及音色轉變	蝴蝶
(3d)女生聲音, 及同步 MIDI 播放	鳳尾草