一、連続音・CVVC的并用 · 2021/07/03

#03　子音速度的局限性

前文提到了发音不够强和吞音之类的问题，

其实可以用提高子音速度来解决，

而且我相信大部分人会这样做。

虽然很有用，但这样处理多少有点粗暴。

UTAU 的音符属性「子音速度」用以控制如图彩色标注区域的时长：

对于「- あ」（或単独音「あ」）：子音速度控制洋红色区域（あ的音头）的时长。

~~货真价实童叟无欺的子音速度~~

对于「a か」：子音速度控制黄色区域的时长。

这一整段就是原音設定里的固定範囲。

你可以看到，固定範囲其实大体上包括四个不同性质的区段，

按发声先后顺序排列分别是：

① 前一个音节的母音尾部

稳定的母音区段（用于交叉过渡）

语流音变区段

② Gap（闭塞段）

③ VOT（嗓音起始时间）

④ 后一个音节的母音头部

语流音变区段

稳定的母音区段（用于拉伸）

搞什么，这难道不是分了六个区段吗

如果对連続音的子音速度进行调整，

UTAU 就会把上述四个本应分别处理的部分一视同仁地均匀拉伸。

但如前文所说，Gap + VOT 存在着比较稳定的固有时长而不该被压缩。

这一特性是由人类发声器官的特定构造与活动方式决定的，

这意味着人不管嘴巴得多快，也会留出最小限度的 Gap +VOT 固有时长

同时，大脑能精准识别语流中的这个时长，并把它作为音节辨识的条件：

子音速度过高，Gap + VOT 被压缩得过短，发音就会变得难以被辨识。

~~有没有调早口歌把 vel 设高结果每个字都发清楚了一连起来反而听不懂的经历？~~

子音速度的调整不能保证連続音中 Gap + VOT 值稳定不变，

所以需要插入 VC 音素分别调整 Gap 和 VOT 的时长。

这也是前文所说的，“ UTAU 的拼接机制和連続音不完全适配 ” 的一种表现。

再说简单些就是：

破裂音需要谨慎使用大于100的子音速度数值

粗略估算了一下，尽量不要超过130

这里指的是原音已经录得很连贯的音源，

辅音录得较长的音源的话，自然是调到顺耳为止…！

~~想听我黑历史的人可以听听子音速度 160 的 CatDog ，真的很反面教材~~

~~有非常明显的不协调感，字与字都粘在一起了~~

コメントをお書きください

コメント: 0