开始合成子音我决定从 k 入手,主要是这样考虑:
- k 在无声子音里算是比较响亮(?)的,持续时间也比较长
- k 是破擦音,先把破和擦的成分都实现了的话其他的子音做起来会更顺手
- 五十音顺最靠前
破裂音属于「闭塞→爆破→送气」的发音,
闭塞动作只影响前一个母音;
爆破的时刻,波形在接近瞬时的极短时间内出现较大变化,高频成分多
所以在语谱图上呈现出全频段能量较强而持续时间短「冲直条」:
送气时语谱图上会留下无规则的中高频噪声乱纹,
破擦音的送气部很短,纯摩擦音的送气部分更明显:
乱纹可以用高斯白噪声削减低频成分并强调共鸣成分来模拟。
冲直条可能通过直接调整采样点数值制造跳变会更好……?
不过我手笨(…),这里录了指甲敲击桌面的碰撞音来当素材。
一开始我试着做的是子音 ky,
一般来说き・きゃ前面的 ky 与か・く等前面的 k 有较大差别
- 送气偏多,持续时间较长
- 保留了非常明显的い的特征,容易出效果
这是一个用于参考的 ky:
可以看到这个子音的构成大概是气声+头部到前半段的数个针状跳变。
参考这个构成,我这样制作一个 ky 子音:
- 轨道1:生成的母音い(滤除1500Hz以下的成分,用于强调特征)
- 轨道2:高斯白噪声(乱纹的主体,参考いF2的位置强调出3000~4000Hz成分)
- 轨道3:3、4个紧密排布的敲击素材(构成冲直条)
简单混合后再调整包络成ky的样子:ky.wav
意外地很像一个真人的子音……!
说明这种做法还是比较可行的。
接下来就是做一个 k,k和ky的不同主要在于:
- 语音特征接近中央元音/ə/,小开口度的发音可能会更接近う
- 持续时间更短
过程略,这是成品:k.wav
比起 ky,这个就明显差强人意了。
不知道是ky这种长的子音确实更容易出效果还是单纯地我手艺不行。
コメントをお書きください