发表于:2011/9/7 9:45:23
#0楼
[/URL]1 [/URL]傅立叶变换
只要是理工科毕业的朋友,都学过傅立叶级数与傅立叶变换,但真正要与实际应用联系起来,用它来阐述应用中的各类问题,我们总会感觉概念模糊,似懂非懂,不知从何说起。是的,作者和你一样,常常有这样的体会。现在,让我与你一起重新学习傅立叶的基本理论和应用,最后还给出一份FFT(快速傅立叶变换)的源码(基于C)。希望对你有所帮助。Let’s go!
1. 历史回顾
谈傅立叶变换,不能不说三角函数。三角函数起源于18世纪,主要是与简谐振动的研究有关。当时的科学家傅立叶对三角函数作了深入研究,并用三角级数解决了很多热传导的问题。三角函数的展开式如下:
f(t) = (1/2a0) + (a1·cos(x)+b1·sin(x)) + (a2·cos(2x)+b2·sin(2x)) + …
其中,系数a和b表示不同频率阶数下的幅度。
成立条件:
n 周期性条件,也就是说f(x)描述的波形必须每隔一段时间周期T就会重复出现;
n Dirichlet条件,周期T内,有限的最大最小值,有限的不连续点;
任何区间内绝对可积;
研究目的:
把一个基于时间变量t的函数展开成傅立叶级数的目的是分解为不同的频率分量,以便进行各种滤波算法。这些基本的组成部分是正弦函数SIN(nt)和余弦函数COS(nt)。
应用领域:
l 信号分析,包括滤波、数据压缩、电力系统的监控等;
l 研究偏微分方程,比如求解热力学方程的解时,把f(t)展开为三角级数最为关键。
l 概率与统计,量子力学等学科。
2. 傅立叶变换
H(w) = ∫h(t)·e^jwt·dt, (区间:-∽~+∽,w = 2πf)
讨论:这里为什么会选择复指数的形式而没有用正弦余弦表示?
答案:欧拉公式的引入使得这条经典的数学公式变得更简单,即e^jx = cos(x) + jsin(x)
3. 快速傅立叶变换(FFT)
常规的傅立叶变换算法并不适用于嵌入式控制系统,原因是运算量太大(涉及到复数运算),比如离散的傅立叶变换等同于用序列Y(n×1列矢量)乘以n×n 矩阵Fn,需要n×n次乘法。若n=1024,则是104,8576次乘法运算。哇,这么多呀!什么概念呢?如果你选用的CPU单周期指令为25ns, 单周期也可以完成一次乘法运算,那么要计算1024点的傅立叶变换则需要26.2144ms,这还不包括加法或其它运算,对于大多数实时系统,这个处理时间实在太长。于是寻找一个快速的傅立叶变换算法是人们所期望的。
本来我想把FFT的整个数学推导过程列完出来,但当自己硬着头皮看完后,发现对我没有任何用处,我又不是专门研究数学算法的,哪有那么多时间跟着书本的公式去慢慢推导。我想,这些推导问题还是让数学家想去吧。我需要的不过是理解它,然后学会应用它就行。有兴趣的读者可以参考相关的资料,这方面的资料实在太多了。
虽然FFT大幅度地降低了常规傅立叶变换的运算量,但对于一般的单片机而言,处理FFT运算还是力不从心。主要原因是FFT计算过程中的蝶形运算是复数运算,要分开实部和虚部分别计算,想想这是多么繁琐的事情。可能会有些初学者认为,有这么复杂吗?我在PC上使用C++一样可以对复数直接进行加、减、乘、除运算。你说得不错,可以这么做,但那是C++封装了对复数处理的类,直接调用就行。在PC上运算这种类型的算法一般不考虑时间和空间,多一两秒的运行时间不会有什么灾难性的结果。
所以我们要衡量一个处理器有没有足够的能力来运行FFT算法,根据以上的简单介绍可以得出以下两点:
l 处理器要在一个指令周期能完成乘和累加的工作,因为复数运算要多次查表相乘才能实现。其二就是间接寻址,可以实现增/减1个变址量,方便各种查表方法。
l FFT要对原始序列进行反序排列,处理器要有反序间接寻址的能力。
所以,在数字信号的分析处理应用中,DSP比其它的处理器有绝对的优势,因为DSP完全具备以上条件。这就是单片机(51系列,AVR,PIC等等)或ARM处理器很少用来进行数字信号分析的原因。
void fft(int n, double theta, double ar[], double ai[])
{
int m, mh, i, j, k;
double wr, wi, xr, xi;
for (m = n; (mh = m >> 1) >= 1; m = mh)
{
for (i = 0; i < mh; i++)
{
//TRACE("i=%d\n", i);
wr = cos(theta * i);
wi = sin(theta * i);
for (j = i; j < n; j += m)
{
k = j + mh;
xr = ar[j] - ar[k];
xi = ai[j] - ai[k];
ar[j] += ar[k];
ai[j] += ai[k];
ar[k] = wr * xr - wi * xi;
ai[k] = wr * xi + wi * xr;
}
}
theta *= 2;
}
/* ---- unscrambler ---- */
i = 0;
for (j = 1; j < n - 1; j++)
{
for (k = n >> 1; k > (i ^= k); k >>= 1);
if (j < i) {
xr = ar[j];
xi = ai[j];
ar[j] = ar[i];
ai[j] = ai[i];
ar[i] = xr;
ai[i] = xi;
}
}
}
只要是理工科毕业的朋友,都学过傅立叶级数与傅立叶变换,但真正要与实际应用联系起来,用它来阐述应用中的各类问题,我们总会感觉概念模糊,似懂非懂,不知从何说起。是的,作者和你一样,常常有这样的体会。现在,让我与你一起重新学习傅立叶的基本理论和应用,最后还给出一份FFT(快速傅立叶变换)的源码(基于C)。希望对你有所帮助。Let’s go!
1. 历史回顾
谈傅立叶变换,不能不说三角函数。三角函数起源于18世纪,主要是与简谐振动的研究有关。当时的科学家傅立叶对三角函数作了深入研究,并用三角级数解决了很多热传导的问题。三角函数的展开式如下:
f(t) = (1/2a0) + (a1·cos(x)+b1·sin(x)) + (a2·cos(2x)+b2·sin(2x)) + …
其中,系数a和b表示不同频率阶数下的幅度。
成立条件:
n 周期性条件,也就是说f(x)描述的波形必须每隔一段时间周期T就会重复出现;
n Dirichlet条件,周期T内,有限的最大最小值,有限的不连续点;
任何区间内绝对可积;
研究目的:
把一个基于时间变量t的函数展开成傅立叶级数的目的是分解为不同的频率分量,以便进行各种滤波算法。这些基本的组成部分是正弦函数SIN(nt)和余弦函数COS(nt)。
应用领域:
l 信号分析,包括滤波、数据压缩、电力系统的监控等;
l 研究偏微分方程,比如求解热力学方程的解时,把f(t)展开为三角级数最为关键。
l 概率与统计,量子力学等学科。
2. 傅立叶变换
H(w) = ∫h(t)·e^jwt·dt, (区间:-∽~+∽,w = 2πf)
讨论:这里为什么会选择复指数的形式而没有用正弦余弦表示?
答案:欧拉公式的引入使得这条经典的数学公式变得更简单,即e^jx = cos(x) + jsin(x)
3. 快速傅立叶变换(FFT)
常规的傅立叶变换算法并不适用于嵌入式控制系统,原因是运算量太大(涉及到复数运算),比如离散的傅立叶变换等同于用序列Y(n×1列矢量)乘以n×n 矩阵Fn,需要n×n次乘法。若n=1024,则是104,8576次乘法运算。哇,这么多呀!什么概念呢?如果你选用的CPU单周期指令为25ns, 单周期也可以完成一次乘法运算,那么要计算1024点的傅立叶变换则需要26.2144ms,这还不包括加法或其它运算,对于大多数实时系统,这个处理时间实在太长。于是寻找一个快速的傅立叶变换算法是人们所期望的。
本来我想把FFT的整个数学推导过程列完出来,但当自己硬着头皮看完后,发现对我没有任何用处,我又不是专门研究数学算法的,哪有那么多时间跟着书本的公式去慢慢推导。我想,这些推导问题还是让数学家想去吧。我需要的不过是理解它,然后学会应用它就行。有兴趣的读者可以参考相关的资料,这方面的资料实在太多了。
虽然FFT大幅度地降低了常规傅立叶变换的运算量,但对于一般的单片机而言,处理FFT运算还是力不从心。主要原因是FFT计算过程中的蝶形运算是复数运算,要分开实部和虚部分别计算,想想这是多么繁琐的事情。可能会有些初学者认为,有这么复杂吗?我在PC上使用C++一样可以对复数直接进行加、减、乘、除运算。你说得不错,可以这么做,但那是C++封装了对复数处理的类,直接调用就行。在PC上运算这种类型的算法一般不考虑时间和空间,多一两秒的运行时间不会有什么灾难性的结果。
所以我们要衡量一个处理器有没有足够的能力来运行FFT算法,根据以上的简单介绍可以得出以下两点:
l 处理器要在一个指令周期能完成乘和累加的工作,因为复数运算要多次查表相乘才能实现。其二就是间接寻址,可以实现增/减1个变址量,方便各种查表方法。
l FFT要对原始序列进行反序排列,处理器要有反序间接寻址的能力。
所以,在数字信号的分析处理应用中,DSP比其它的处理器有绝对的优势,因为DSP完全具备以上条件。这就是单片机(51系列,AVR,PIC等等)或ARM处理器很少用来进行数字信号分析的原因。
void fft(int n, double theta, double ar[], double ai[])
{
int m, mh, i, j, k;
double wr, wi, xr, xi;
for (m = n; (mh = m >> 1) >= 1; m = mh)
{
for (i = 0; i < mh; i++)
{
//TRACE("i=%d\n", i);
wr = cos(theta * i);
wi = sin(theta * i);
for (j = i; j < n; j += m)
{
k = j + mh;
xr = ar[j] - ar[k];
xi = ai[j] - ai[k];
ar[j] += ar[k];
ai[j] += ai[k];
ar[k] = wr * xr - wi * xi;
ai[k] = wr * xi + wi * xr;
}
}
theta *= 2;
}
/* ---- unscrambler ---- */
i = 0;
for (j = 1; j < n - 1; j++)
{
for (k = n >> 1; k > (i ^= k); k >>= 1);
if (j < i) {
xr = ar[j];
xi = ai[j];
ar[j] = ar[i];
ai[j] = ai[i];
ar[i] = xr;
ai[i] = xi;
}
}
}