#01 时频图(语谱图)


 

 

通过傅里叶变换可以把复杂信号分解为简单正弦波,如下图,

 

这是一张经典的傅里叶变换原理图:

 

图片引用自 MIT OpenCourseWare > Speech Science Exercise 5: Introduction to Praat

 

 

它直观地解释了时域信号与频域信号如何相互转换。

 

还反映出复合信号分解后时间・频率・信号幅值三个量之间的对应关系:

 

  • 信号在时间-幅值平面的投影,即,时域图像:波形(waveform)
  • 信号在频率-幅值平面的投影,即,频域图像:频谱图(spectrum)

 

信号的频谱图与时间无关,各个频率分量也只是简单周期函数。

 

要同时分析信号在时间和频域两个维度的变化的话,

 

我们需要的是时频图(spectrogram,或译语谱图、声谱图),

 

可以理解为上图的俯瞰图(但不完全是)。

 

 

 

大多数软件提供的所谓 spectrum 其实不是频谱图而是时频图。

 

大多数人应该也用不得到完整信号的频谱图,吧。

 

 

 

先对时域信号分帧加窗,再进行傅里叶变换,得到大量的短时谱,

 

最后将短时谱排序并绘图,就可以分析频率成分随时间变化的情况。

 

 

 

如果短时谱以动画形式播放,就可以得到像 EQ 和母带那样的可视化动态图像;

 

如果以时间和频率分别作为为 x 轴和 y 轴的自变量,

 

在 x-y 平面上用不同颜色表示短时谱的幅值,这样就就得到时频图。

 

时频图是平面图,但有三个维度,属于拟似色彩图(pseudo-color image)。

 

 

 

周波数表(也就是日语的频率表)是每个 UTAU 音源中与原音设定一样重要的标记文件。

 

不同的重采样引擎使用不同格式的周波数表,

 

默认系(resampler、fresamp14等)使用.frq 格式,TIPS 使用.pmk 格式,等等。

 

 

 

一般在引擎初次运行时会自动生成自己周波数表,

 

但时不时会出错,需要手动修正,而时频图是编辑周波数表的重要工具。

 

 

 

 

 

【参考资料】