EDN China > 其它文章 > 消费电子设计 > 便携设备 > 正文
? 2016博客大赛-不限主题,寻找电子导师,大奖升级??

以正确的视频架构实现产品差异化

Ron Wilson?? EDN执行主编?? 2006年12月07日 ?? 收藏0

关于这一话题可以有很多变化。例如,Qualcomm也用自己的 一组CPU plus硬件架构与一个类似的问题打交道,这就是一系列带有视频游戏功能的手机。但Renesas的芯片是面向狭窄范围的市场,而Qualcomm则要设计一种能用于手机游戏市场的各种价格与性能点的SoC。这个手机巨人的高级产品经理Dave Ligon解释说:“理想情况下,在不同的性能水平上,你要对架构作不同的折衷。我们将市场分为三个区段:主要对成本敏感的多媒体手机;增强型手机;以及游戏需求最迫切的聚合平台。”

  Qualcomm选择的结构直接反映出这三个区段。例如,多媒体手机平台的应用 DSP 内核实现几何处理,而 ARM 内核用作基于软件的光栅化。大量本地内存的适当组织可以实现这个水平的性能目标。

  增强型平台采用的是硬件光栅化。Z-buffer与其他基于硬件的提早退出策略共同保证了只有可见像素才能通过流水线。几何DSP内 核直接连接到光栅化引擎,以减少总线或共享内存方案消耗的能量。另外,除为一个小型LCD产生信号以外,光栅引擎还驱动一个移动显示处理器,实现简单的2D运行。

  在高端,聚合平台采用了ATI2300图形内核的衍生物,并结合了一个增强版本的移动显示处理器。Ligon 说 :“聚合平台的图形性能略高于Silicon Graphics Octane工作站,当

我在Silicon Graphics工作时该工作站是那时最热门的产品。而且这是手机中的一个单封装系统。”

  他说,实际上图形 API 大量地隐藏了三种平台之间显著的硬件差异,因此游戏开发者几乎可以将它们三个看作一种平台。当上升为产品系列时,OEM会看到增加的特性,但在软件接口方面没有根本的变化。这种方案可以为各种任务提供最高的能效。但正如 Qualcomm 用三款不同芯片表明的那样,灵活性意味着需要额外的芯片设计。对一个有良好客户关系并且资金充裕的公司,它有信心冲击一个巨型市场,这种折衷是有益的,但并非所有人都有这种条件。

  增加可编程性

  从单纯CPU为中心的结构(其中硬接线引擎环绕着一个可编程核),到一种更灵活的架构(专用引擎本身变成可编程的),这是一个自然的演变。采用德州仪器公司(TI)DaVinci 平台的最新构想表明了这个首要步骤(图 2)。TI员工Ray Simar评论说:“硬接线块和可编程块都有自己的天地。重要的是不要用一种先入为主的结构着手,而要先理解应用的需求,以及它们随时间会如何发展。然后再考虑结构。”

TI 的 DaVinci 方法组合一个 CPU、一个独立的 DSP 核,以及实现目标所必需的一种寄存器可配置块和可编程块的混合体


  为功能块增加某种水平可编程性的成本已在逐步下降。Simar说:“对所有人来说,功耗正在成为一个更困难的问题。但有了日益完善的功率管理技术以及良好的内存结构,可编程块的功耗就能接近于一个硬接线块的功耗。”

  Simar 亦指出可编程性的幅度发生在各个块内,并依赖于计算的精细度以及一个功能块必须完成的模式数量。在某些情况下(例如运动预测搜索与比较),一次运行非常接近于一个固定的数据流模型,寄存器编程的状态机就可以覆盖所有应用的需求。在其他情况下,一次运行中可能存在很多变异,或者一个功能可能非常依赖于数据,于是只有一个保存程序的设备和程序计数器能保持运行的足够灵活性。TI 在其 DSP 核以外利用了整个选项范围。

  很多设计者会把某种功能看作是固定不变的,但实际上它日益需要编程能力,这就是 DMA。一个多媒体子系统中的数据运动可以非常复杂、依赖数据并且变化多端。很多情况下,数据块在 DRAM 中的简单进出可能会导致灾难。TI 用一种嵌入式 SRAM 的组合解决了这个问题,这个组合大到足以保存该块完成功能的全部工作集;必要时的流通结构;以及可编程 DMA 控制器,利用功能块和 DDR DRAM 的需求来与 DRAM 流量模式匹配。

  同位多处理

  相同类型的分析能使架构师得出不同结论,这种分析开始于用例、判别任务,以及将它们划分为硬件、可配置或软件驱动的块。例如,Nvidia 的 GoForce 系列产品就采用硬接线引擎,但工作量落在源于 Tensilica 的增强型指令集可编程 DSP 核上。DSP 核本身在微观上重复相同的类型;Nvidia 则以固定硬件实现指令的增强。

  Nvidia 产品营销总监 Geoff Ballew 认为:“你必须非常清楚什么要做成硬件。”另一方面,固定硬件可提供最佳的能效,优于增加的 DSP 块,而且远远好于一般的 DSP 核。再者,你最好作明智的选择。例如,有时你可以通过少许工作而重新使用一个块,使之具有跨各种编解码器的固定功能。

  部分问题是,在系统级上没有用于能量剖析的好工具。要判断哪个块为主要的能耗者是一个挑战。一旦判定了这些块,Nvidia 就可以进一步压缩它们,采用动态、细颗粒的时序门控来切换块内电路组的开、关,从而最大程度地减小能耗。

  


?? ?? ??


打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

1.扫描左侧二维码
2.点击右上角的分享按钮
3.选择分享给朋友
?? ??

视频? 产品差异化? 便携?

相关文章

我来评论
美国的游客
美国的游客 ??? (您将以游客身份发表,请登录 | 注册)
?
有问题请反馈