#03 子音速度的局限性


 

 

前文提到了发音不够强和吞音之类的问题,

 

其实可以用提高子音速度来解决,

 

而且我相信大部分人会这样做。

 

虽然很有用,但这样处理多少有点粗暴。

 

 

 

UTAU 的音符属性「子音速度」用以控制如图彩色标注区域的时长:

 

 

对于「- あ」( 或単独音「あ」):子音速度控制洋红色区域(あ的音头)的时长。

 

货真价实童叟无欺的子音速度

 

对于「a か」:子音速度控制黄色区域的时长。

 

这一整段就是原音設定里的固定範囲。

 

 

 

你可以看到,固定範囲其实大体上包括四个不同性质的区段,

 

按发声先后顺序排列分别是:

 

  • ① 前一个音节的母音尾部
  • 稳定的母音区段(用于交叉过渡)
  • 语流音变区段
  •  Gap(闭塞段)
  •  VOT(嗓音起始时间)
  •  后一个音节的母音头部
  • 语流音变区段
  • 稳定的母音区段(用于拉伸)

 

搞什么,这难道不是分了六个区段吗

 

 

 

如果对連続音的子音速度进行调整,

 

UTAU 就会把上述四个本应分别处理的部分一视同仁地均匀拉伸。

 

 

 

但如前文所说,Gap + VOT 存在着比较稳定的固有时长而不该被压缩。

 

 

 

这一特性是由人类发声器官的特定构造与活动方式决定的,

 

这意味着人不管嘴巴得多快,也会留出最小限度的 Gap +VOT 固有时长

 

同时,大脑能精准识别语流中的这个时长,并把它作为音节辨识的条件:

 

  • 子音速度过高,Gap + VOT 被压缩得过短,发音就会变得难以被辨识。

 

有没有调早口歌把 vel 设高结果每个字都发清楚了一连起来反而听不懂的经历?

 

 

 

子音速度的调整不能保证連続音中 Gap + VOT 值稳定不变,

 

所以需要插入 VC 音素分别调整 Gap 和 VOT 的时长。

 

这也是前文所说的,“ UTAU 的拼接机制和連続音不完全适配 ” 的一种表现。

 

 

 

再说简单些就是:

 

  • 破裂音需要谨慎使用大于100的子音速度数值
  • 粗略估算了一下,尽量不要超过130

 

这里指的是原音已经录得很连贯的音源,

 

辅音录得较长的音源的话,自然是调到顺耳为止…!

 

 

 

想听我黑历史的人可以听听子音速度 160 的 CatDog ,真的很反面教材

 

有非常明显的不协调感,字与字都粘在一起了