通过傅里叶变换可以把复杂信号分解为简单正弦波,如下图,
这是一张经典的傅里叶变换原理图:
图片引用自 MIT OpenCourseWare > Speech Science Exercise 5: Introduction to Praat
它直观地解释了时域信号与频域信号如何相互转换。
还反映出复合信号分解后时间・频率・信号幅值三个量之间的对应关系:
- 信号在时间-幅值平面的投影,即,时域图像:波形(waveform)
- 信号在频率-幅值平面的投影,即,频域图像:频谱图(spectrum)
信号的频谱图与时间无关,各个频率分量也只是简单周期函数。
要同时分析信号在时间和频域两个维度的变化的话,
我们需要的是时频图(spectrogram,或译语谱图、声谱图),
可以理解为上图的俯瞰图(但不完全是)。
大多数软件提供的所谓 spectrum 其实不是频谱图而是时频图。
大多数人应该也用不得到完整信号的频谱图,吧。
先对时域信号分帧加窗,再进行傅里叶变换,得到大量的短时谱,
最后将短时谱排序并绘图,就可以分析频率成分随时间变化的情况。
如果短时谱以动画形式播放,就可以得到像 EQ 和母带那样的可视化动态图像;
如果以时间和频率分别作为为 x 轴和 y 轴的自变量,
在 x-y 平面上用不同颜色表示短时谱的幅值,这样就就得到时频图。
时频图是平面图,但有三个维度,属于拟似色彩图(pseudo-color image)。
周波数表(也就是日语的频率表)是每个 UTAU 音源中与原音设定一样重要的标记文件。
不同的重采样引擎使用不同格式的周波数表,
默认系(resampler、fresamp14等)使用.frq 格式,TIPS 使用.pmk 格式,等等。
一般在引擎初次运行时会自动生成自己周波数表,
但时不时会出错,需要手动修正,而时频图是编辑周波数表的重要工具。
【参考资料】
コメントをお書きください