#03 试着合成子音


 

 

开始合成子音我决定从 k 入手,主要是这样考虑:

  • k 在无声子音里算是比较响亮(?)的,持续时间也比较长
  • k 是破擦音,先把破和擦的成分都实现了的话其他的子音做起来会更顺手
  • 五十音顺最靠前

 

 

破裂音属于「闭塞→爆破→送气」的发音,

 

闭塞动作只影响前一个母音;

 

爆破的时刻,波形在接近瞬时的极短时间内出现较大变化,高频成分多

 

所以在语谱图上呈现出全频段能量较强而持续时间短「冲直条」:

 

 

送气时语谱图上会留下无规则的中高频噪声乱纹,

 

破擦音的送气部很短,纯摩擦音的送气部分更明显:

 

 

 

 

乱纹可以用高斯白噪声削减低频成分并强调共鸣成分来模拟。

 

冲直条可能通过直接调整采样点数值制造跳变会更好……?

 

不过我手笨(…),这里录了指甲敲击桌面的碰撞音来当素材。

 

 

 

一开始我试着做的是子音 ky,

 

一般来说き・きゃ前面的 ky 与か・く等前面的 k 有较大差别

 

  • 送气偏多,持续时间较长
  • 保留了非常明显的い的特征,容易出效果

 

这是一个用于参考的 ky:

 

 

可以看到这个子音的构成大概是气声+头部到前半段的数个针状跳变。

 

 

 

 

参考这个构成,我这样制作一个 ky 子音:

 

  • 轨道1:生成的母音い(滤除1500Hz以下的成分,用于强调特征)
  • 轨道2:高斯白噪声(乱纹的主体,参考いF2的位置强调出3000~4000Hz成分) 
  • 轨道3:3、4个紧密排布的敲击素材(构成冲直条)

 

简单混合后再调整包络成ky的样子:ky.wav

 

 

意外地很像一个真人的子音……!

 

 

 

说明这种做法还是比较可行的。

 

接下来就是做一个 k,k和ky的不同主要在于:

  • 语音特征接近中央元音/ə/,小开口度的发音可能会更接近う
  • 持续时间更短

 

过程略,这是成品:k.wav

 

 

比起 ky,这个就明显差强人意了。

 

不知道是ky这种长的子音确实更容易出效果还是单纯地我手艺不行。