前文提到了发音不够强和吞音之类的问题,
其实可以用提高子音速度来解决,
而且我相信大部分人会这样做。
虽然很有用,但这样处理多少有点粗暴。
UTAU 的音符属性「子音速度」用以控制如图彩色标注区域的时长:
对于「- あ」( 或単独音「あ」):子音速度控制洋红色区域(あ的音头)的时长。
货真价实童叟无欺的子音速度
对于「a か」:子音速度控制黄色区域的时长。
这一整段就是原音設定里的固定範囲。
你可以看到,固定範囲其实大体上包括四个不同性质的区段,
按发声先后顺序排列分别是:
- ① 前一个音节的母音尾部
- 稳定的母音区段(用于交叉过渡)
- 语流音变区段
- ② Gap(闭塞段)
- ③ VOT(嗓音起始时间)
- ④ 后一个音节的母音头部
- 语流音变区段
- 稳定的母音区段(用于拉伸)
搞什么,这难道不是分了六个区段吗
如果对連続音的子音速度进行调整,
UTAU 就会把上述四个本应分别处理的部分一视同仁地均匀拉伸。
但如前文所说,Gap + VOT 存在着比较稳定的固有时长而不该被压缩。
这一特性是由人类发声器官的特定构造与活动方式决定的,
这意味着人不管嘴巴得多快,也会留出最小限度的 Gap +VOT 固有时长
同时,大脑能精准识别语流中的这个时长,并把它作为音节辨识的条件:
- 子音速度过高,Gap + VOT 被压缩得过短,发音就会变得难以被辨识。
有没有调早口歌把 vel 设高结果每个字都发清楚了一连起来反而听不懂的经历?
子音速度的调整不能保证連続音中 Gap + VOT 值稳定不变,
所以需要插入 VC 音素分别调整 Gap 和 VOT 的时长。
这也是前文所说的,“ UTAU 的拼接机制和連続音不完全适配 ” 的一种表现。
再说简单些就是:
- 破裂音需要谨慎使用大于100的子音速度数值
- 粗略估算了一下,尽量不要超过130
这里指的是原音已经录得很连贯的音源,
辅音录得较长的音源的话,自然是调到顺耳为止…!
想听我黑历史的人可以听听子音速度 160 的 CatDog ,真的很反面教材
有非常明显的不协调感,字与字都粘在一起了
コメントをお書きください