- 首先感谢 masao さん开发了好用得不行的插件:周波数表エディタ
真的帮大忙了……
下文描述的操作默认在周波数表エディタ中进行。
展示的图片也都是周波数表エディタ的界面截图。
- 对于声音信号,一般来说,越复杂的声波谐波分量越多
- 对于人声演唱,一般来说,越饱满的音色泛音列越完整
带腔体共鸣的人声歌唱包含强烈且层次丰富而的泛音,
在共鸣和共振峰的影响下,通常 1k~4kHz 范围内出现最强的谐波。
如果对专业歌手的泛音分析有兴趣的话请善用互联网资源。
具体讨论 UTAU 音源的话,
- 怒り表情音源、キレ風表情音源、叫び音源,etc
这些强力、有咆哮感的发音往往带有强而复杂的谐波。
依照前文介绍,当谐波强度较大时算法可能会把谐波误认为基波。
此时算法给出的 F0 值是某次谐波的频率。
因为谐波频率是基频的整数倍,故称此类错误为 F0 的倍频。
倍频是最常见的周波数表问题,绝大部分具有这样的特征:
- F0 跳变后,变化趋势与跳变之前保持一致
- 跳变后数值大约是跳变前的整数倍
- 最直观的:F0 落在谐波条带而非基波条带上
由于二次谐波往往最强,倍频问题中最常见的则是 2 倍频问题。
下图是经典的 2 倍频周波数表:
用「/2」处理 2 倍频部分的数值就好。
另外,在较强发声的情况,
由于喉咙的紧绷,通常也会出现复杂的谐波成分,引发倍频问题。
如图,这是 3 倍频类型的倍频错误:
从谐波理论上分析,不可能像出现 1/2 倍频问题,
但是,实际录音时原音有可能包含频率恰好为基频 1/2 的噪声,
或算法使用了投票决策的方法确定 F0,于是出现了1/2 倍频。
※ 投票决策的基音周期算法的思路是:
- 寻找信号中最强的若干个谐波分量,分别计算它们的1/2、1/3、1/4…,汇总为表
- 对表中列出的所有可能是基频的频率进行置信度投票,选取最可信的结果为 F0
偶尔类似 4/3 这样的分数型奇怪倍频,
不是基频的整数倍,也不落在特定的谐波上,
所以比整数倍难修正一些,但通常可以由简单整数倍组合得到解决。
- 例:4/3 倍通过「×3」「/2」「/2」的连续处理就可以得到正确的F0
コメントをお書きください