时隔多年,我又把正弦波捡起来搓了…!
看到最近无中之人音源多了起来,
大家都好有干劲,我也该努力一把了,至少把烂摊子收拾掉。
……现在写只能是回忆录,但其实我真不记得多少了。
只能翻着自己推特想想大概做了什么工作。
READY? GO! 👇👇👇
分帧调整共振峰
想通了一件事:
- 靠片段交叉淡化不能做出共振峰迁移的效果,那只好滤波器手搓了。
用信号处理的话来说,就是,分帧
用数学的话来说,就是那个,微分思想(啊?
听起来蛮恐怖的,其实还好,
共振峰迁移基本也就几十毫秒,人耳也没那么敏感,
一个衔接处分两三四段差不多了。
重点是,滤波器要用 FFT 的,变换到频谱再滤波再 IFFT 那种,
也许是卷积滤波器的响应延迟太久了,感觉没效果,而且还可能会打乱相位谱。
* 追記 2023.10.12 更新
………………………………………………………………………………………………
后来我才发现 iZotope RX 10 甚至 AU 就有自带的语谱图编辑工具,
可以直接在语谱图上圈选涂抹,这玩意可比滤波器好用多了。
………………………………………………………………………………………………
变声器
这是怎么回事呢?
虽然一开始的目标是中性声,
但实际把原音丢到 UTAU 里过重采样器之后,感觉音色不是我喜欢的,
一不做二不休,干脆把音色变成童声了算了。
找了个效果相对好的变声器(具体哪个不说了
……
……变调参数的单位居然不是半音,草…!
处理过后,无声子音(清辅音)的共振峰也变了,
所以气声类成分受损蛮严重的,
于是只好手动剪掉变调后的无声子音,再把原来的插回去。
调整
吭哧吭哧把常用发音做完,调混发了好几段测试,
针对性地改了点测试发现的问题。
① 子母音衔接还是不够自然
- 口腔开合主要影响 F1 的迁移,所以再调整一下音头音尾的 F1
用的滤波器长大概这样:
动静不用太大,微调一下 F1 附近的能量分配就行。
② 音色还是闷
其实变声器改变音高时缺失的频带已经补齐了……
但对比其他 幼女/萌妹/少女 的音色,我觉得还可以再提一下 6~10kHz 频段。
至此,合成子(乳名&爱称)已经成为我家力度最强的音源了!
天呐!!!怎么会这样!!!
补充音阶
再来一次变声器流程,搓了低音一阶。好累啊!(再次
刚变调完的声音蛮奇怪的。
F3 以下的能量分配差一点都对音色听感有很大影响,
相对来说倍频频点的分布又很稀疏,
算法上维持共振峰的响应曲线拟合?之类的部分总是不够精准,
所以 5 个母音+鼻音还得微调。
连续音DLC
之前的版本一直是我流CVVC+小部分VCV,
也就是我认为性价比(连贯性 / 原音量)最高的方案,
一种概念最小系统……
用的时候发现,UST里音符太多的话拼接器运行太慢了……
就干脆做完连续音吧。
虽然只需要把已有的素材拼贴组合,但对齐相位真的不是该人类自己干的事情……
清辅音类的都偷懒用 UTAU 配合 $direct=True 来出了,
浊辅音手拼,天哪……
因为DLC部分严格按小节线拼的,所以窝头大部分是 SetParam 直出(。
完!
コメントをお書きください