免费论文网 首页

单精度浮点性能

时间:2018-11-09 11:23 来源:免费论文网

篇一:一种单精度浮点倒数开方运算的硬件实现

一种单精度浮点倒数开方运算的硬件实现

摘要:单精度浮点倒数开方运算在gpu设计中经常会用到。实现这种运算一般有两种方法,迭代法和查表法。迭代法要根据精度要求确定迭代次数,只需要很小的存储器保存迭代初值,但需要的运算器数量较多。查表法根据输入的数据直接从rom中查表得到结果,需要占用的存储资源比较多。该文提出了一种间接查表法实现的浮点倒数开方运算实现方法,将迭代法和直接查表法的优点结合起来。经过理论推导和硬件仿真验证,该算法能够满足单精度浮点数的运算精度。

关键词:单精度浮点;倒数开方;查表

中图分类号:tp312 文献标识码:a 文章编号:1009-3044(2013)09-2242-04

单精度浮点倒数开方运算在gpu设计中经常会用到。在硬件设计中一般有两种实现方法,一种是采用迭代法,比较著名的是牛顿-辛普森迭代法;另一种方法是查表法。两种方法各有优缺点:迭代法需要的存储资源比较小,但是要达到单精度浮点数的精度要求,需要进行多级迭代,所耗费的运算资源比较大;而查表法不需要运算资源,但是需要占用的存储器资源数量会比较大。所以结合这两种实现方法的优缺点,该文实现了一种间接查表法,利用泰勒级数展开,取出适当的位数位数进行查表,然后再进行运算得出满足精度要求的结果,在存储资源和运算资源方面进行了平衡。 1 ieee 754单精度浮点数据格式

篇二:浮点数的表示和计算

《计算机组成原理》实验报告

报告创建时间:2014.12.30

篇三:Nvidia GPU性能对比

Nvidia GPU性能对比

目前Nvidia推出支持CUDA架构用GPU运算的图形处理器分别:GeForce系列、Quadro系列、及专业GPU Tesle系列。从价格上来排序为GeForce最便宜为Tesla的1/2不到。Quadro价格比Tesla更高暂不评测。从Nvidia推出GPU运算以来,很多专业人士就不断尝试用GeForce显卡来做GPU运算,核心数量一样,价格有很大优势,从表面上看就是内存好像比Tesla少了些。究竟性能如何来看一下,下面测试GeForce GTX470性能测试。

GeForce GTX470参数:

下面用GPU基准测试软件对GTX470各个方面进行了测试,Nvidia GTX470单精度浮点运算性能为1049Gflops,而Tesla C2050的单精度浮点运算为1.03Tflops,说明在单精度浮点运算方面GTX470与C2050性能相当。

下面再在对比一下双精度浮点运算。由下图可能看出GTX470的双精度浮点运算为134Gflops,是单精度浮点运算的1/8,我们再来看一下C2050的双精度浮点运算为515Gflops.由此可见Nvidia采用Fermi架构后双精度浮点运算能力C2050要远远大于GTX470。

下面再来看一下GTX470其它方面的性能

Tesla C2O50参数

由上图对比可以看出GTX470与C2050 除内存不同、与内存带宽不同其它几乎相同。而Nvidia为什么推出专业的GPU运算处理器Tesla系列,而不采用GeForce显卡来做并行运算呢?而Tesla C2050系列处理器将近GeForce GTX470价格的三倍,到底不何不同呢?

根据测试及Nvidia官方资料做出了以下总结: 首先,Tesla系列比GeForce系列内存要高出一倍,而通过CUDA开发的程序要做一个并行运算,首先要把数据调入显存,显存与GPU的每个核心交换数据,这样显卡的内存越大对大规模的并行运算程序越好。运行小程序中表现不出来。

通过以上测试GeForce显卡双精度浮点运算约为单精度浮点运算的1/8,而Tesla Fermi系列双精度约为单精度的1/2.这是因为Nvidia设计不同,GeForce采用了openGL图形加速度技术。而降低的双精度浮点运算的性能。Tesla不支持openGL加速度技术,而增强的双精度浮点运算性能。Geforce显卡还支持3D立体幻影、NVIDIA PureVideo等。Tesla支持异步传输、并行datacache技术等,由此可见GeForce专为图形处理而设计,Tesla专为并行运算而设计。.

建议用户在选择购买GPU时根据需求来选择是用Tesla还是GeForce。

如果你是企业用户主要工作处理大规模地震资料,石油及天燃汽应用最好选择Tesla系统,因为这些程序所处理的数据一般为TB甚至PB的海量数据,需要大容量内存支持。如果你所应用程序为分子动力学等软件,可选择采用GeForce 系列。选择Geforce时为能达到高的稳定性最好选择降频使用。


单精度浮点性能
由:免费论文网互联网用户整理提供,链接地址:
http://m.csmayi.cn/meiwen/25510.html
转载请保留,谢谢!
相关阅读
最近更新
推荐专题