日前,NVIDIA发布了目前市场上性能最强的通用计算卡——Tesla M2090,并且Tesla M2090已被装配在惠普的HP ProLiant SL390 G7高性能计算4U服务器中,该机最高可搭载8块Tesla M2090以及两颗CPU。
Tesla M2090提供512个并行处理核心,双精度浮点峰值性能665GFlops,单精度浮点峰值性能1331GFlops。搭配6GB GDDR5缓存,关闭ECC校验状态下的显存带宽为177GB/s。因为是面向数据中心、超级计算机等用户,所以M2090和M2070/M2050一样,在散热设计上没有使用风扇,仅用热管散热器依靠机架内风扇进行散热。当然,显示输出接口在这样的通用计算卡上也肯定不会存在。尽管Fermi架构Tesla早在2009年就已经发布,不过由于供电、散热等方面的限制,将当时面向工作站的Tesla C2070/C2050和Tesla M2070/M2050两组SM进行了部分屏蔽,仅启用448个CUDA核心。而今,游戏市场的GeForce GTX 580通过使用GF110改进核心已经开启了完整的512个CUDA核心,Tesla M2090就是它对应的高性能计算版本。
据NVIDIA的官方测试,4块Tesla M2090加4颗CPU的系统可在AMBER 11分子模拟运算中,每天完成69纳秒的模拟,而之前仅使用CPU的超级计算机最高记录也是每天46纳秒。
(第三媒体 2011-05-18)