在HLS中用C語言實現(xiàn)8192點FFT,經(jīng)過測試,實驗結(jié)果正確,但是時序約束不到100M的時鐘,應(yīng)該是設(shè)計上的延時之類的比較大,暫時放棄這個方案,調(diào)用HLS中自帶的FFT庫(hls:fft)hls_fft.h。實際上,在HLS中調(diào)用該庫實現(xiàn)FFT,其實是Vivado中的那個FFT核實現(xiàn)的,但是HLS中的配置和給定輸入輸出數(shù)據(jù)比較方便,并且對其外部封裝其他類型的總線接口非常容易。
1.hls_fft.h初探
(資料圖)
在HLS中打開示例例程 fft_single ,注意以下幾點:
(1)默認(rèn)設(shè)定
【1】輸入數(shù)據(jù)和輸出數(shù)據(jù)的格式固定,必須采用16位定點復(fù)數(shù)數(shù)據(jù),其中1bit表示整數(shù),其他的表示小數(shù)部分,即輸入數(shù)據(jù)范圍 —1 ~ 1,輸出也是 —1 ~ 1;
【2】結(jié)構(gòu)類型為流水線型;
【3】默認(rèn)點數(shù)1024點,當(dāng)不是這個點數(shù)時,除了修改頭文件的點數(shù),還需要修改config里的參數(shù)才能重新配置IP核;
【4】默認(rèn)輸入輸出16位定點,相位因子16位,如果需要改成浮點數(shù)輸入輸出,需要更改相位因子為24或25位,并且在config里面更改IP核的配置;
【5】HLS中的FFT的IP庫只處理復(fù)數(shù)類型complex的FFT數(shù)據(jù)。
【6】Xilinx FFT IP塊只對復(fù)數(shù)類型數(shù)據(jù)進行操作。盡管可以對把所有虛部都設(shè)為0的復(fù)數(shù)進行FFT,但是通過預(yù)處理數(shù)據(jù)可以更有效地執(zhí)行FFT。
【7】HLS需要bit-reverse命令數(shù)據(jù)塊后端,所說的自然順序和一個O (N)轉(zhuǎn)換適用于FFT輸出提取的頻譜數(shù)據(jù)N-point真實數(shù)據(jù)集。注意,第一個輸出兩包第0個和512(純粹的)分別輸出頻譜數(shù)據(jù)的實部和虛部。
【8】設(shè)計是完全流水線,流設(shè)計高吞吐量;用于數(shù)據(jù)的連續(xù)處理,但具有節(jié)流功能(如果輸入停止,則停止)。
【9】AXI4-Stream接口用于連接IP Integrator (IPI)中的所有塊。
(2)在testbench中自己給輸入信號進行測試,先給定一個正弦信號,注意下面的賦值,在2016.2版本是可以直接給復(fù)數(shù)的實部和虛部賦值的,但是2018.2這種方式會報錯,需要采用下面的賦值函數(shù)來給一個復(fù)數(shù)賦值
(3)scale放縮因子的設(shè)定 如果不設(shè)置放縮因子,輸入上述 —1 ~ 1的正弦信號后,輸出結(jié)果應(yīng)該為
可以看到,最大值在x[100]處,虛部已經(jīng)到-503級別,不符合輸出數(shù)據(jù)的要求,在此過程中,需要對數(shù)據(jù)按照FFT的級數(shù)縮放,如下圖所示,示例中設(shè)置1024點的FFT的放縮因子為0X2AB,即 10 10 10 10 11,按照每2bit合在一起,即為 2 2 2 2 3,依次相加為(2+2+2+2+3)=11,放縮倍數(shù)為2^11=2048。
具體scale的設(shè)置詳見PG109,翻譯過來就是:
對于突發(fā)I/O架構(gòu),每個階段的擴展調(diào)度由最低位的兩個LSBs指定,第一個階段的擴展調(diào)度由兩個最低位LSBs指定??s放可以指定為3、2、1或0,表示要移位的數(shù)目。例如:
【1】對于N =1024, Radix-4突發(fā)I/O是[1 0 2 3 2](從最后一級開始排序)
【2】對于N =128, x-2突發(fā)I/O或Radix-2 Lite Burst I/O,一種可能的擴展計劃是[1 1 1 1 1 0 1 2] (從最后階段到第一階段排序)。
對于流水線并行I/O架構(gòu)(示例默認(rèn)使用流水線型),每個Radix-2階段(從兩個LSBs開始)都使用兩位指定伸縮因子。例如:
【4】N = 256的縮放調(diào)度可以是[2 2 2 3]。當(dāng)N不是4的冪時,最后階段的最大位增長為1位。例如,[0 2 2 2]或[1 2 2 2 2]對于N = 512是有效的擴展調(diào)度,但是[2 2 2 2 2]是無效的。對于這個轉(zhuǎn)換長度,SCALE_SCH的最高位的兩個MSB只能是00或01。此字段僅適用于按比例縮放的算術(shù)(不包括未縮放unscaled、塊浮點或單精度float)。
2.更改配置
(1)改成8192點FFT(2^13)
【1】更改最大支持點數(shù)FFT_NFFT_MAX=13,這時候FFT_LENGTH也隨之改變,效果為該FFT支持最大8192點(當(dāng)設(shè)置為最大支持8192點時,4096/256等比8192小的點數(shù)也是支持的),并且本次運行點數(shù)時8192點。
【2】修改config配置信息,將修改的點數(shù)寫進fft的配置,如果沒有110行的修改,那么實際上還是執(zhí)行的1024點的FFT。
【3】修改放縮因子為0XAAB(8192點FFT,縮小8192倍,一般多少點設(shè)置多少倍,然后看overflow信號是否指示數(shù)據(jù)溢出,若溢出,則繼續(xù)增大縮放因子)
此后點擊運行,得到的結(jié)構(gòu)范圍在 —1 ~ 1之間,將所有數(shù)據(jù)*8192,得到正常的數(shù)據(jù),但是,因為前面的放縮實在每一級上的累計放縮,所以存在較大的誤差累積,通過和C語言double型正常未放縮執(zhí)行的代碼對比,發(fā)現(xiàn)在輸出數(shù)據(jù)較小的地方誤差非常大,基本可以看成是錯的,在數(shù)據(jù)較大的地方,比如本例的100Hz的sin信號,在輸出xk_output[100] 處與實際結(jié)果誤差很小。
3.更改輸入輸出為float型,提高精度
對于單精度浮點型輸入,輸入數(shù)據(jù)時N維復(fù)數(shù)向量(雙32位浮點數(shù)),相位因子必須是24或者25位的定點數(shù)(PG109文檔)。
4.結(jié)果
編輯:黃飛
標(biāo)簽: