国产精品视频播放更新_亚洲精品中文综合_凌晨三点3免费观看_无码A级免费毛片视频_综合久久网


您的位置:中華顯示網(wǎng) > 新聞動態(tài) > 產(chǎn)品應(yīng)用 >

FPGA首次集成硬核浮點DSP

編輯:admin 2014-05-12 12:09:51 瀏覽:1455  來源:華強(qiáng)電子網(wǎng)

  

  Altera公司日前宣布在FPGA浮點DSP性能方面實現(xiàn)了重大突破。該公司首席DSP產(chǎn)品規(guī)劃經(jīng)理Michael Parker稱,Altera是第一家能夠在FPGA中集成硬核IEEE 754兼容浮點運算功能的可編程邏輯公司,前所未有的提高了DSP性能、邏輯效率和設(shè)計效能。根據(jù)規(guī)劃,硬核浮點DSP模塊將集成在正在發(fā)售的20nm Arria 10 FPGA和SoC中,也將集成在14nm Stratix 10 FPGA和SoC中,DSP設(shè)計人員可以選擇定點或者浮點模式,浮點模塊與現(xiàn)有設(shè)計后向兼容。

  面向高性能計算,與GPGPU展開競爭

  與傳統(tǒng)使用定點乘法器和FPGA邏輯來實現(xiàn)浮點功能的做法不同,Altera的硬核浮點DSP幾乎不使用現(xiàn)有FPGA浮點計算所需要的邏輯資源,釋放了上千個乘法器和加法器,從而一舉在Arria 10器件中實現(xiàn)了1.5 TeraFLOP (每秒浮點運算次數(shù))和Stratix 10器件中10 TeraFLOP的DSP性能。

  “這要歸功于我們創(chuàng)新的精度可調(diào)DSP體系結(jié)構(gòu)?!盇ltera公司軟件和DSP產(chǎn)品市場經(jīng)理 Albert Chang說,在DSP模塊現(xiàn)有模式(標(biāo)準(zhǔn)精度定點模式和高精度定點模式)基礎(chǔ)上添加浮點模式,Altera FPGA和SoC的性能和功耗效率將在很多領(lǐng)域高于目前正在使用的微處理器和GPU,尤其是那些需要高性能計算的行業(yè)(大數(shù)據(jù)分析、石油和天然氣行業(yè)的地震建模、金融仿真、雷達(dá)和醫(yī)療成像等)。但其對定點模式并沒有影響(性能、大小和功耗),且對管芯總體改變<1%。

FPGA首次集成硬核浮點DSP0

  Altera 方面稱,其開發(fā)的硬核浮點FPGA產(chǎn)品的競爭對手并非來自同行,而是通用圖形處理單元(GPGPUs)?!捌渌鸉PGA廠商提供的‘軟核’浮點使用了邏輯來實現(xiàn)復(fù)數(shù)浮點電路,是缺乏功效和競爭力的?!盡ichael Parker打比方說,這就好像數(shù)年前沒有硬核乘法器的FPGA,卻總在試圖和現(xiàn)代具備DSP模塊的FPGA進(jìn)行競爭一樣可笑。

  盡管類似 OpenCL這樣的公共設(shè)計流程可以用在FPGA和GPGPU上,但兩者在算法實現(xiàn)上有很大的不同。GPGPU使用了并行處理器體系結(jié)構(gòu),并行運行數(shù)千個浮點乘加小單元。算法被分成數(shù)萬個線程,然后再將數(shù)據(jù)映射到計算單元中;而Altera FPGA使用了流水線邏輯體系結(jié)構(gòu),是將幾千個計算單元排列成流數(shù)據(jù)流電路,在矢量上運行(FFT內(nèi)核或者Cholesky分解內(nèi)核就是類似的例子)。每一個內(nèi)核在每一時鐘周期產(chǎn)生矢量輸出數(shù)據(jù),矢量寬度由設(shè)計人員決定。

  Michael Parker 認(rèn)為,F(xiàn)PGA在高性能計算方面相對較新,但是具有競爭優(yōu)勢。首先,由于采用流水線邏輯體系結(jié)構(gòu),數(shù)據(jù)流的處理延時要比GPU低得多,在金融交易算法等某些應(yīng)用中,這是關(guān)鍵優(yōu)勢;其次,F(xiàn)PGA的GFLOPS/W性能要優(yōu)于GPGPU,這在航空電子等環(huán)境不受控的應(yīng)用中非常關(guān)鍵;第三,F(xiàn)PGA具有很好的通用性和廣泛的連通性。例如,F(xiàn)PGA可以直接與天線陣輸入連接,完成定點和浮點處理,同時通過光纖或者背板鏈路與其他系統(tǒng)組件通信。

  硬核浮點DSP模塊縮短6-12個月的開發(fā)時間

  由于設(shè)計人員可以將其DSP設(shè)計直接轉(zhuǎn)譯成浮點硬件,而不是轉(zhuǎn)換為定點,從而大幅度縮短了時序收斂和驗證時間。相比此前系列,硬核浮點DSP模塊能夠縮短近12個月的開發(fā)時間。

FPGA首次集成硬核浮點DSP1

  Albert Chang認(rèn)為,自然支持浮點功能對于設(shè)計人員在FPGA中實現(xiàn)復(fù)雜的高性能算法非常重要—在構(gòu)建系統(tǒng)之前,在浮點中完成所有算法開發(fā)和仿真;完成算法后,通常還需要6-12個月的投入,在定點實現(xiàn)中分析、轉(zhuǎn)換并驗證浮點算法。需要克服的三個主要問題包括:

  1. 必須手動將浮點設(shè)計轉(zhuǎn)換為定點,這需要非常有經(jīng)驗的工程師。盡管這樣,其實現(xiàn)的數(shù)字精度也沒有仿真高。

  2. 如果以后對算法進(jìn)行任何修改,也需要再次進(jìn)行手動轉(zhuǎn)換。而且,優(yōu)化系統(tǒng)中定點算法的任何步驟都不會反映在仿真中。

  3. 如果系統(tǒng)集成和測試過程中出現(xiàn)了問題,其原因可能如下:手動轉(zhuǎn)換過程有錯誤,數(shù)字精度問題,或者算法本身就有問題。隔離問題會非常困難。使用Altera浮點FPGA能夠避免所有這些問題。

  為了幫助硬件設(shè)計人員、基于模型的設(shè)計人員以及軟件編程人員在器件中輕松實現(xiàn)高性能浮點DSP模塊,Altera還同時提供多種工具流程,包括:

  DSP Builder高級模塊庫提供了基于模型的設(shè)計流程,設(shè)計人員使用業(yè)界標(biāo)準(zhǔn)MathWorks Simulink工具在幾分鐘內(nèi)就可以完成系統(tǒng)定義和仿真,直至系統(tǒng)實現(xiàn)。

  對于軟件編程人員,Altera在FPGA編程中率先使用了OpenCL,并面向FPGA提供基于C語言的通用高級設(shè)計流程。Arria 10 FPGA浮點DSP模塊結(jié)合使用方便的開發(fā)流程,為軟件編程人員提供了硬件直接轉(zhuǎn)譯方法,幫助他們縮短了開發(fā)和驗證時間。

  2014 年下半年,Altera將提供面向Arria 10器件中硬核浮點DSP模塊的浮點設(shè)計流程,包括演示和基準(zhǔn)測試。在此之前,用戶可以采用Arria 10 FPGA開始設(shè)計,使用軟件浮點技術(shù)來實現(xiàn)浮點功能,在得到設(shè)計流程支持后,軟件工具會自動(一次重新編譯)將浮點算法無縫映射到硬核浮點運算中,而不必使用軟核邏輯。

FPGA首次集成硬核浮點DSP2

標(biāo)簽:

關(guān)注我們

公眾號:china_tp

微信名稱:亞威資訊

顯示行業(yè)頂級新媒體

掃一掃即可關(guān)注我們

0.218750s