一種高分辨率合成孔徑雷達(dá)并行成像實(shí)現(xiàn)
摘 要:并行處理是快速處理合成孔徑雷達(dá)數(shù)據(jù)(SAR),實(shí)現(xiàn)實(shí)時(shí)處理的有效途徑。本文采用 了一種細(xì)粒度的并行算法實(shí)現(xiàn)SAR成像,將原始數(shù)據(jù)劃分為子孔徑數(shù)據(jù),并分配給并行機(jī)的各節(jié) 點(diǎn),使用針對(duì)子孔徑的CS處理和方位向子孔徑算法,對(duì)各節(jié)點(diǎn)的數(shù)據(jù)進(jìn)行處理。通過(guò)在并行機(jī)SGI Origin2000平臺(tái)上的實(shí)驗(yàn)證明,該算法與中粒度并行cS成像算法相比,能有效地減少通信量,有 利于成像處理的并行擴(kuò)展, 同時(shí)獲得更好的分辨率。
SAR成像處理具有數(shù)據(jù)量和運(yùn)算量大的特點(diǎn)【l】,為了提高運(yùn)算速度,實(shí)現(xiàn)實(shí)時(shí)成像,通常采用并行計(jì)算機(jī)進(jìn) 行并行處理。SAR的成像處理具有潛在的并行性,能較為容易地并行化I2】。在并行處理的數(shù)據(jù)劃分方面,中粒度 劃分和粗粒度劃分是較為常用的方法。
文獻(xiàn)【3.4】介紹了SAR原始數(shù)據(jù)數(shù)據(jù)粗粒度劃分的處理方法。每個(gè)處理器 得到一幀回波數(shù)據(jù),獨(dú)立完成整幀圖像的處理過(guò)程,各處理器是獨(dú)立的,彼此之間沒(méi)有通信。粗粒度并行減少了 系統(tǒng)的通信需求,但由于各節(jié)點(diǎn)的數(shù)據(jù)量大,對(duì)節(jié)點(diǎn)的運(yùn)算能力和存儲(chǔ)能力要求高。數(shù)據(jù)的中粒度劃分方式在
文 獻(xiàn)【2,5】中進(jìn)行了討論,這是目前典型的SAR并行處理方式,能獲得較好的并行效率。它將一幀數(shù)據(jù)再進(jìn)行劃分 并分配給并行系統(tǒng)的各處理器,每塊數(shù)據(jù)分別依照成像算法的步驟進(jìn)行處理。 在中粒度并行成像算法中,并行機(jī)各節(jié)點(diǎn)間通常需要通信。以CS算法的中粒度并行化為例【2】。由于在距離 徙動(dòng)校正上避免了插值,并能獲得很高的成像精度,CS算法已成為目前流行的SAR成像算法【6】。在并行處理中, CS算法需要進(jìn)行3次數(shù)據(jù)矩陣的轉(zhuǎn)置,會(huì)帶來(lái)3次并行機(jī)各節(jié)點(diǎn)間的通信 】,需要消耗大量的時(shí)間。 同時(shí),對(duì)中粒度并行Cs算法而言,如果為了提高運(yùn)算速度,采用具有更多節(jié)點(diǎn)的并行機(jī),就會(huì)導(dǎo)致分配到 各節(jié)點(diǎn)上的數(shù)據(jù)小于一個(gè)孔徑【引,并會(huì)造成圖像分辨率的明顯下降。因此SAR 的中粒度并行算法不利于并行擴(kuò) 展,增大并行度就會(huì)影響到圖像質(zhì)量。 本文對(duì)SAR 的原始數(shù)據(jù)進(jìn)行細(xì)粒度劃分,將子孔徑數(shù)據(jù)分配給各節(jié)點(diǎn),采用針對(duì)子孔徑的Cs處理和方位 向子孔徑算法實(shí)現(xiàn)成像。 l 子孔徑的CS處理和方位子孔徑處理 中粒度并行cS算法[21中,對(duì)整塊原始數(shù)據(jù)進(jìn)行cS變換,3次矩陣轉(zhuǎn)置就帶來(lái)了3次所有節(jié)點(diǎn)間的通信。 cS處理利用發(fā)射信號(hào)是線性調(diào)頻信號(hào)的性質(zhì),通過(guò)改變信號(hào)相位中心,實(shí)現(xiàn)對(duì)距離徙動(dòng)曲線的尺度變換,使不 同距離上的曲線彎曲程度一致【9】。這里將原始數(shù)據(jù)劃分為子孔徑,每個(gè)子孔徑數(shù)據(jù)含有一定數(shù)量的線型調(diào)頻脈沖 信號(hào)。根據(jù)線型調(diào)頻信號(hào)的性質(zhì),我們可以對(duì)每塊子孔徑數(shù)據(jù)分別進(jìn)行cs處理,從而避免了各節(jié)點(diǎn)間的通信。 以場(chǎng)景中心點(diǎn)為參考點(diǎn)(參考點(diǎn)可隨意選取),它與雷達(dá)間的最小距離 為參考距離。先對(duì)子孔徑數(shù)據(jù)進(jìn)行方位 向FFT,然后與CS因子相乘: (f,f; )=exp{一jrLK(f; )X (廠)X【t一2RX(廠; )/c】 ) (1) 式中: C (,)= 一1;K (,; = . .2 c等 每 。 【l一( ) 】 ;R(廠; )= 【l+C (廠)】; 廠為方位向頻率;K為發(fā)射信號(hào)的調(diào)頻率;v為雷達(dá)載機(jī)速率; ,.為距離變量。然后在節(jié)點(diǎn)內(nèi)轉(zhuǎn)置,進(jìn)行距離向 FFT,并乘上距離壓縮和徙動(dòng)校正因子: ( ,廠; )=exp{_j 2 ’×exp【 4x CJ(廠)】 式中 為距離向頻率。方位向壓縮則采用子孔徑處理的方式: 圖1數(shù)據(jù)劃分和子孔徑處理 N N N I N l 廠d( )= 三Ⅳ ,( ) , Ⅳ ,( )=, ⅣLEja,( ) ,( J , [ aN+Sa(i-I)( Ⅳ+1)(r)+.. Ⅳ-1)( )] (2) (3) 式中:廠d(f)為方位壓縮的結(jié)果; (f)為方位向子孔徑數(shù)據(jù); (f)為與之對(duì)應(yīng)的參考函數(shù)。子孔徑處理需要子 孔徑數(shù)據(jù)間的相互重疊 】,在本文提出的算法中,為了避免在cs處理步驟上對(duì)數(shù)據(jù)的重復(fù)處理,將數(shù)據(jù)劃分為 子塊,分配給各節(jié)點(diǎn),分別進(jìn)行cS處理后,再通過(guò)各節(jié)點(diǎn)間的一次通信,兩個(gè)子塊組成一個(gè)子孔徑數(shù)據(jù)(圖l(a)), 從而完成方位壓縮。即采取子孔徑間重疊50%的劃分方式。根據(jù)文獻(xiàn)【l0】和后面的實(shí)驗(yàn),這樣做是可取的。方位 向處理如圖1(b)所示,其中“rf’’是參考函數(shù)的縮寫(xiě)。
2 實(shí)驗(yàn)結(jié)果
2.1在SGI Origin2000上的實(shí)驗(yàn)結(jié)果 實(shí)驗(yàn)所用的平臺(tái)為SGI Origin2000,是一種對(duì)稱處理并行機(jī)。 其硬件配置如表1所示: 本文所采取的細(xì)粒度并行成像方法在SGI Origin2000上的運(yùn) 算結(jié)果如表2所示。由于并行機(jī)上共有8個(gè)處理器,因此采用2,4 和8個(gè)處理器分別實(shí)現(xiàn)來(lái)觀察結(jié)果。實(shí)驗(yàn)數(shù)據(jù)為雷達(dá)實(shí)測(cè)數(shù)據(jù),參 數(shù):矩陣點(diǎn)數(shù)16 384~8 192(方位×距離,含有兩個(gè)全孔徑數(shù)據(jù)),波 長(zhǎng)3 cm,分辨率1 mxl m(方位×距離)。表中詳細(xì)列出了CS處理和 方位向子孔徑處理的各個(gè)步驟運(yùn)算時(shí)間。 表l SGI Origin2000的硬件配置 表2細(xì)粒度并行方法在SGI Origin2000上的實(shí)驗(yàn)結(jié)果 從運(yùn)算結(jié)果上看,隨著處理器個(gè)數(shù)的增加,成像處理的時(shí)間明顯減少,用于CS處理和方位壓縮的時(shí)間也成 比例地減少。但是,由于通信量隨著處理器個(gè)數(shù)而變化(處理器越多,劃分的數(shù)據(jù)塊越小,參與通信的節(jié)點(diǎn)也越 多),且系統(tǒng)的通信性能相比運(yùn)算性能要弱得多,因此花在通信上的時(shí)間并沒(méi)有減少。這就導(dǎo)致了效率隨著處理 器個(gè)數(shù)增加而下降。如果采用通信性能更好的并行系統(tǒng),如MPP,這一點(diǎn)可以得到改善。
2.2并行效率比較 根據(jù)文獻(xiàn)【2】中的中粒度并行cs算法流程,本文所采取的方法與其相比,有兩點(diǎn)不同: 1)通信次數(shù)不同。中粒度并行cS算法中含有3次矩陣轉(zhuǎn)置,需要3次所有節(jié)點(diǎn)間的通信;本文的方法只 需要1次通信,在方位壓縮之前; 2)方位壓縮的運(yùn)算量不同。中粒度并行cs算法采用普通的方位壓縮,而本文采用了子孔徑處理,根據(jù)式(3), 方位壓縮的運(yùn)算量要大一些。 由于條件限制,我們將文獻(xiàn)【2】中的中粒度并行CS算法移植到當(dāng)前平臺(tái)上。實(shí)驗(yàn)數(shù)據(jù)仍然采用2.1中的實(shí)測(cè) 數(shù)據(jù)。設(shè)原始數(shù)據(jù)的距離向點(diǎn)數(shù)為Ⅳ,,方位向點(diǎn)數(shù)為Ⅳ ,子孔徑的方位向點(diǎn)數(shù)為Ⅳ ,每塊全孔徑數(shù)據(jù)劃分為P 個(gè)子塊,則中粒度并行CS算法方位壓縮的運(yùn)算量為: l ‰ =Ⅳ甜×Ⅳ,+ ×Ⅳ,×log2Ⅳ珊 (4) Z 本文方法的方位壓縮運(yùn)算量為: Sr8=2×(P一1)× ×Ⅳ,+(P+1)×Ⅳ甜×,v,×log2Ⅳm (5) 運(yùn)算效率的計(jì)算可參考文獻(xiàn)【8】。兩種算法的通信時(shí)間見(jiàn)圖2(a)。方位壓縮時(shí)間見(jiàn)圖2(b),而各種情況下算法 的效率見(jiàn)圖2(c)。
中粒度并行cS算法的通信時(shí)間較長(zhǎng),而本文的方法花在方位壓縮上的時(shí)間較長(zhǎng),總的來(lái)說(shuō), 兩種算法效率相當(dāng)。 雖然本文的方法在運(yùn)算量上較中粒度并行CS算法有所增加,但在通信方面有所改善。對(duì)于目前的計(jì)算機(jī)系 統(tǒng)來(lái)說(shuō),通信性能明顯弱于計(jì)算性能,且通信性能的改善也比計(jì)算性能的改善要困難一些。因此,該方法在通信 量上的減少,更有利于算法性能的進(jìn)一步提高。中粒度并行CS算法與本文方法的比較 2.3 并行擴(kuò)展性比較 考慮到圖像的質(zhì)量,本文的方法比中粒度并行CS算法有著更好的并行擴(kuò)展度,更有利于獲得高分辨率圖像。 采用上面的數(shù)據(jù),矩陣大小取32 768x8 192(4個(gè)全孔徑數(shù)據(jù))。圖3顯示了在4個(gè)處理器和8個(gè)處理器的情況下, 中粒度并行CS算法的成像結(jié)果。對(duì)于4個(gè)處理器,每個(gè)節(jié)點(diǎn)上分配1個(gè)全孔徑數(shù)據(jù);而對(duì)于8個(gè)處理器,子數(shù) 據(jù)塊就只包含1/2個(gè)合成孔徑,這將導(dǎo)致分辨率的下降。圖3的結(jié)果說(shuō)明了這一點(diǎn)。對(duì)中粒度并行CS算法而言, 更大規(guī)模的并行化將明顯影響到圖像質(zhì)量。 圖4顯示了在4個(gè)處理器和8個(gè)處理器的情況下,本文方法的成像結(jié)果。由于子孔徑的劃分具有一定靈活度, 根據(jù)文獻(xiàn)[10】,全孔徑數(shù)據(jù)可以劃分為4~16子孔徑,子數(shù)據(jù)塊的大小在一定范圍內(nèi)的變化不會(huì)明顯影響到結(jié)果, 因此兩幅圖像幾乎沒(méi)有差別。如果要求獲得高分辨率圖像,本文的方法更有利于更大規(guī)模的并行化。 (a)Oil4processors (b)Oil 8 processors Fig.3 Imaging results(part1 ofmedium·grained CS algorithm Oil diferent scale ofparallel systems 圖3中粒度并行CS算法在不同規(guī)模并行機(jī)上的成像結(jié)果(部分)
3 結(jié)論
上面的實(shí)驗(yàn)結(jié)果說(shuō)明,與中粒度并行CS算法相比,本文所采取的細(xì)粒度并行處理方法有效地降低了通信量, 并具有更好的并行擴(kuò)展度。同時(shí)由于采取了子孔徑算法,更有利于高分辨率SAR進(jìn)行并行處理。本文的子孔徑 算法為基本子孔徑處理,還可以考慮文獻(xiàn)[i11提出的改進(jìn)子孔徑算法,甚至Step變換,對(duì)本文的方法進(jìn)行改進(jìn)。 此外,如果具有更好的硬件條件,如MPP并行機(jī),應(yīng)能取得更好的效果。