EDN China > 其它文章 > 微处理器与DSP > 多媒体处理器 > 正文
? 2016博客大赛-不限主题,寻找电子导师,大奖升级??

(多图) 激烈的平台之争GPU垂涎CPU的地盘

Brian Dipert?? EDN高级技术编辑?? 2006年01月10日 ?? 收藏0

作由程序确定并有序执行的一些指令。程序员定义好运算发生的次序,而程序计数器根据这个次序控制指令的执行”(参考文献 5)。与之相比,图形加速器一直要对多种信息进行同时运算。(正如 Nvidia公司 技术营销副总裁 Tony Tamasi 在最近一次演说中所称:“麻烦的是图形的并行性”。)但是,从历史上看,图形加速器是吸入图像原素而吐出着色后像素的硬连线状态机(参考文献 6)。

  CPU 和 GPU 都在近些年得到了发展,并倾向于减小两者之间的差异,重新定义它们的相互关系,使它们朝着冲突的方向前进。随着 SIMD(单指令、多数据)指令集的出现,如 Intel公司 的 MMX(多媒体扩展)及随后迭代的 SSE(流 SIMD 扩展)和 AMD公司 的 3DNow!、PowerPC公司 的 AltiVec,CPU 已经可以用一个普通指令同时处理多个数据(参考文献 7)。接下来出现了超标量 CPU,它可以并行地处理多个独立指令。Intel公司 的超线程(Hyper Threading)特性将并行机制提升到了一个新水平,实现了多个指令线程的有限并行执行,而现在多家供应商新推出的多内核 CPU 则用

一种更普遍的形式将此能力进一步外推(图 2)。那么图形加速器在做什么?引用一段 Kirk 为创新的图形参考指南 GPU Gems 所写的介绍:“我们已经进入了可编程 GPU 时代。图形硬件管线过去 20 年没有显著变化,现在它打破了构成的硬连接元素,重新构建出可编程的并行管线处理器。在硬连线管线中,三角形顶角被改变并显示,三角形被光栅化,而像素则用扩散光照、镜面取幂、走光融合和帧缓冲融合进行着色。”

多家供应商新推出的多内核 CPU 则用一种更普遍的形式将此能力进一步外推

点击看原图

?

多家供应商新推出的多内核 CPU 则用一种更普遍的形式将此能力进一步外推

  Kirk 继续说:“在可编程管线中,每一个这类操作都抽象为其内存存取和算术运算。程序员仍编写计算与硬连线管线相同结果的程序......但出现的机会却多得多”(参考文献 8)。除了 CPU 和 GPU 的发展以外,平台变换的另一个关键之处是互连它们的总线的改进。以今天的术语,多个竞争性外设要共享 PCI 带宽,它的速度慢得像糖浆流动一样,对于1.05Gbps的单向峰值带宽而言为32b和33MHz。专为图形而定制的 AGP(图形加速端口)总线的最高速度扩展可达 16.8 Gbps 峰值带宽(8 x 型),但这只是单向速度,即从 CPU 至 GPU。经过AGP 总线从 GPU 返回 CPU 的数据流动要慢得多,峰值速度只有 1 x AGP(2.1 Gbps,或 PCI 的两倍),上行的 AGP 信息量也因相干性和所用的 PCI 设备而经受窥探。

  在 PCI Express 第 1版 中,每一个四信号的“通路”都支持同步与双向的 2 Gbps 数据传送(原带宽为 2.5 Gbps,去掉 8/10 b 编码开销)。换句话说,它支持总计达 4 Gbps的峰值带宽。今天 PC 中一般的 PCI Express 实现方法是专门将一个 16 路连接到图形子系统,因此在 CPU 和 GPU 之间建立起一个真正令人惊愕的带宽。过去,将信息送给 GPU 作中间处理是没有意义的,因为即使 GPU 能够处理速度快于 CPU的数据,但将结果传回 CPU 会发生不可接受的延迟。向 PCI Express 的转换显然能够缓解 AGP 上行的瓶颈问题。2005年7月下旬 Intel 开发者论坛(www.intel.com/idf)上的演讲为即将到来的 PCI Express 第 2版 规范铺平了道路,它的单路带宽将再次翻倍。

第一次转换

  当几年前 DVD-ROM驱动器开始出现在 PC 中时,它主要还是用于播放视频 DVD,那时 GPU 供应商就看到了第一次打破纯图形盒子的绝好机会。这对笔记本电脑尤其具备吸引力,因为它使用的 CPU 功能低于台式系统。而且由于笔记本电脑是电池供电的,因此对功耗的考虑就更多一些。硬连线 MPEG-2 解码的功耗要高于软件为中心的方案。这样,GPU 从开始做最后一步彩色空间变换,后来更扩展到前级的运算,如 iDCT(反向离散余弦变换)和运动补偿,承担了处理 480 线分辨率 DVD 解码的大部分重担。(现在更扩展到包括 720 线和 1080 线分辨率的 HDTV。)台式机与笔记本电脑的差异今天仍然存在。例如,Intel 945G 台式内核逻辑芯片组内的图形内核要完成彩色空间变换、iDCT 和运动补偿,而移动电脑中使用的 945GM 则要将更多晶体管用于处理变长的无损解码任务。

  起初,DVD 播放软件不得不着重于对图形子系统的检查,看用的是哪种 GPU,然后采用众多的 GPU专用例程来反映每种芯片的硬件加速功能。例如,早期 Nvidia 芯片在 MPEG-2 性能方面要低于 ATI 技术公司相对应产品。(但是,


?? ?? ??


打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

1.扫描左侧二维码
2.点击右上角的分享按钮
3.选择分享给朋友
?? ??

GPU? CPU? 竞争?

相关文章

我来评论
美国的游客
美国的游客 ??? (您将以游客身份发表,请登录 | 注册)
?
有问题请反馈