快捷搜索:

FPGA相比GPU和CPU有什么行业竞争优势

(文章滥觞:和讯网)

与其他谋略载体如CPUGPU比拟,FPGA具有高机能、低能耗以及可硬件编程的特征。图1先容了FPGA的硬件架构,每个FPGA主要由叁个部分组成:输入输出逻辑,主要用于FPGA与外部其他部件,比如传感器的通信;谋略逻辑部件,主要用于建造谋略模块;以及可编程衔吸收集,主要用于连接不合的谋略逻辑部件去组成一个谋略器。

在编程时,我们可以把谋略逻辑映射到硬件上,经由过程调剂收集连接把不合的逻辑部件连通在一路去完成一个谋略义务。比如要完成一个图像特性提取的义务,我们会连接FPGA的输入逻辑与拍照机的输出逻辑,让图片可以进入FPGA。然后,连接FPGA的输入逻辑与多个谋略逻辑部件,让这些谋略逻辑部件并行提取每个图片区域的特性点。着末,我们可以连接谋略逻辑部件与FPGA的输出逻辑,把特性点汇总后输出。由此可见,FPGA平日把算法的数据流以及履行指令写逝世在硬件逻辑中,从而避免了CPU的Instruction Fetch与InstrucTIon Decode 事情。

虽然FPGA的频率一样平常比CPU低,然则可以用FPGA实现并行度很大年夜的硬件谋略器。比如一样平常CPU每次只能处置惩罚4到8个指令,在FPGA上应用数据并行的措施可以每次处置惩罚256个或者更多的指令,让FPGA可以处置惩罚比CPU多很多的数据量。别的,如上所述,在FPGA中一样平常不必要InstrucTIon Fetch与InstrucTIon Decode, 削减了这些流水线工序后也节省了不少谋略光阴。

为了让读者对FPGA加速有更好的懂得,我们总结了微软钻研院2010年对BLAS算法的FPGA加速钻研。BLAS是矩阵运算的底层库,被广泛运用到高机能谋略、机械进修等领域。在这个钻研中,微软的钻研职员阐发了CPU、GPU以及FPGA对BLAS的加速以及能耗。图2比较了FPGA以及CPU、GPU履行GaxPy算法每次迭代的光阴,相对付CPU,GPU与FPGA都达到了60%的加速。图中显示的是小矩阵运算,跟着矩阵的增大年夜,GPU与FPGA相对与CPU的加速比会越来越显着。

FPGA相对付CPU与GPU有显着的能耗上风,主要有两个塬因。首先,在FPGA中没有InstrucTIon Fetch与Instruction Decode,在Intel的CPU里面,因为应用的是CISC架构,仅仅Decoder就占全部芯片能耗的50%;在GPU里面,Fetch与Decode也耗损了10%~20%的能源。其次,FPGA的主频比CPU与GPU低很多,平日CPU与GPU都在1GHz到3GHz之间,而FPGA的主频一样平常在500MHz以下。如斯大年夜的频率差使得FPGA耗损的能源远低于CPU与GPU。

您可能还会对下面的文章感兴趣: