#03 F0的倍频


 

 

 

 

真的帮大忙了……

 

下文描述的操作默认在周波数表エディタ中进行。

 

展示的图片也都是周波数表エディタ的界面截图。

 

 

  • 对于声音信号,一般来说,越复杂的声波谐波分量越多
  • 对于人声演唱,一般来说,越饱满的音色泛音列越完整

 

 

带腔体共鸣的人声歌唱包含强烈且层次丰富而的泛音,

 

在共鸣和共振峰的影响下,通常 1k~4kHz 范围内出现最强的谐波。

 

如果对专业歌手的泛音分析有兴趣的话请善用互联网资源。

 

 

 

具体讨论 UTAU 音源的话,

 

  • 怒り表情音源、キレ風表情音源、叫び音源,etc

 

这些强力、有咆哮感的发音往往带有强而复杂的谐波。

 

 

 

依照前文介绍,当谐波强度较大时算法可能会把谐波误认为基波。

 

此时算法给出的 F0 值是某次谐波的频率。

 

因为谐波频率是基频的整数倍,故称此类错误为 F0 的倍频。

 

 

 

倍频是最常见的周波数表问题,绝大部分具有这样的特征:

 

  • F0 跳变后,变化趋势与跳变之前保持一致
  • 跳变后数值大约是跳变前的整数倍
  • 最直观的:F0 落在谐波条带而非基波条带上

 

由于二次谐波往往最强,倍频问题中最常见的则是 2 倍频问题。

 

下图是经典的 2 倍频周波数表:

 

 

用「/2」处理 2 倍频部分的数值就好。

 

 

 

另外,在较强发声的情况,

 

由于喉咙的紧绷,通常也会出现复杂的谐波成分,引发倍频问题。

 

如图,这是 倍频类型的倍频错误:

 

 

 

 

从谐波理论上分析,不可能像出现 1/2 倍频问题,

 

但是,实际录音时原音有可能包含频率恰好为基频 1/2 的噪声,

 

或算法使用了投票决策的方法确定 F0,于是出现了1/2 倍频。

 

 

※ 投票决策的基音周期算法的思路是:

  • 寻找信号中最强的若干个谐波分量,分别计算它们的1/2、1/3、1/4…,汇总为表
  • 对表中列出的所有可能是基频的频率进行置信度投票,选取最可信的结果为 F0

 

 

 

偶尔类似 4/3 这样的分数型奇怪倍频,

 

不是基频的整数倍,也不落在特定的谐波上,

 

所以比整数倍难修正一些,但通常可以由简单整数倍组合得到解决。

 

  • 例:4/3 倍通过「×3」「/2」「/2」的连续处理就可以得到正确的F0