五、合成音声开发手记 · 2023/03/28

#06　再开!!! 堂堂完结!!!

时隔多年，我又把正弦波捡起来搓了…！

看到最近无中之人音源多了起来，

大家都好有干劲，我也该努力一把了，至少把烂摊子收拾掉。

……现在写只能是回忆录，但其实我真不记得多少了。

只能翻着自己推特想想大概做了什么工作。

READY? GO! 👇👇👇

分帧调整共振峰

想通了一件事：

靠片段交叉淡化不能做出共振峰迁移的效果，那只好滤波器手搓了。

用信号处理的话来说，就是，分帧

用数学的话来说，就是那个，微分思想（啊？

听起来蛮恐怖的，其实还好，

共振峰迁移基本也就几十毫秒，人耳也没那么敏感，

一个衔接处分两三四段差不多了。

重点是，滤波器要用 FFT 的，变换到频谱再滤波再 IFFT 那种，

也许是卷积滤波器的响应延迟太久了，感觉没效果，而且还可能会打乱相位谱。

* 追記　2023.10.12 更新

………………………………………………………………………………………………

后来我才发现 iZotope RX 10 甚至 AU 就有自带的语谱图编辑工具，

可以直接在语谱图上圈选涂抹，这玩意可比滤波器好用多了。

………………………………………………………………………………………………

变声器

这是怎么回事呢？

虽然一开始的目标是中性声，

但实际把原音丢到 UTAU 里过重采样器之后，感觉音色不是我喜欢的，

一不做二不休，干脆把音色变成童声了算了。

找了个效果相对好的变声器（具体哪个不说了

……

……变调参数的单位居然不是半音，草…！

处理过后，无声子音（清辅音）的共振峰也变了，

所以气声类成分受损蛮严重的，

于是只好手动剪掉变调后的无声子音，再把原来的插回去。

调整

吭哧吭哧把常用发音做完，调混发了好几段测试，

针对性地改了点测试发现的问题。

① 子母音衔接还是不够自然

口腔开合主要影响 F1 的迁移，所以再调整一下音头音尾的 F1

用的滤波器长大概这样：

动静不用太大，微调一下 F1 附近的能量分配就行。

② 音色还是闷

其实变声器改变音高时缺失的频带已经补齐了……

但对比其他幼女/萌妹/少女的音色，我觉得还可以再提一下 6~10kHz 频段。

至此，合成子(乳名&爱称)已经成为我家力度最强的音源了！

天呐！！！怎么会这样！！！

补充音阶

再来一次变声器流程，搓了低音一阶。好累啊！（再次

刚变调完的声音蛮奇怪的。

F3 以下的能量分配差一点都对音色听感有很大影响，

相对来说倍频频点的分布又很稀疏，

算法上维持共振峰的响应曲线拟合？之类的部分总是不够精准，

所以 5 个母音+鼻音还得微调。

连续音DLC

之前的版本一直是我流CVVC+小部分VCV，

也就是我认为性价比（连贯性 / 原音量）最高的方案，

一种概念最小系统……

用的时候发现，UST里音符太多的话拼接器运行太慢了……

就干脆做完连续音吧。

虽然只需要把已有的素材拼贴组合，但对齐相位真的不是该人类自己干的事情……

清辅音类的都偷懒用 UTAU 配合 $direct=True 来出了，

浊辅音手拼，天哪……

因为DLC部分严格按小节线拼的，所以窝头大部分是 SetParam 直出（。

完！

コメントをお書きください

コメント: 0