EDN China > 设计实例 > 工业电子 > 工业仪表 > 正文
? 2016博客大赛-不限主题,寻找电子导师,大奖升级??

革命性的新计算技术将促使电力调度得以飞跃发展

徐立子 中国电力科学研究院?? 2012年03月28日 ?? 收藏0
美国 NVIDIA 公司于 2008 年推出 Tesla S1070 1U GPU 多核处理机 及其集群( Cluster ) 系统,以 Teraflop( 万亿次浮点八进制运算 ) 及更高的速度进行高性能的并行多线程通用计算解决方案,其运算速度比过去的 CPU Server 高出几十到几百倍,价格确低几十倍,能耗也大为降低,为世人所瞩目。其 视觉计算系统( Visual Computing System ) - Quadro Plex 1000 代表了在视觉运算技术上的跨纪元的跃进。目前, 我国全国性的互联电网已逐步形成,如何有效地进行管理和控制保证其安全、稳定和经济运行,是极为重要的研究课题。 Tesla GPU 高性能运算的超计算机的问世,使动态、暂态安全监控和 大规模电力系统动态过程实时、超实时仿真变得易于实现。电力市场也可进行实测电厂微增成本和网损微增成本,使电力系统的实时经济调度成为可能。电力调度的质量将会极大的提高。

1 . Tesla GPU 高性能运算 ( High Performance Computing HPC )

1.1 新摩尔定律

* 未来计算机硬件不会更快,但会更 “ 宽 ” ;

* 必须重新设计算法。

1.2 高性能的 Tesla GPU+CPU 运算

图形芯片最初的固定功能是用来绘图。几年后图形芯片逐渐变成可编程的了,这就引导 NVIDIA 提出第一个图形处理器 GPU 。在 1999 - 2000 期间计算机科学家同其它领域的专家如医学成像和电磁学专家等开始用 GPU 来处理通用目的应用计算。他们发现, GPU 卓越的浮点性能可导致科学应用领域的巨大推进。这样,在 GPU 上进行通用目的计算就开始了。问题是,一开始需要使用图形编程语言如 OpenGL 和 Cg 来进行 GPU 编程。程序员为编他们的科学应用程序必须像编图形应用程序和绘图(如三角形和多边形 ) 那样麻烦,这就使具有巨大性能的 GPU 为科学应用服务受到了限制。

NVIDIA 认识到将 GPU 此性能带给大量科学机构的潜力,决定投资修改 GPU ,使它对科学应用来说完全可编程并对高级语言如 C 、 C ++ 、 Fortran 等加以支持。从而导致了 ‘GPU 的 CUDA 体系结构 ' 的出现。

‘ GPU 计算'是使用图形处理器 GPU 来进行多线程并行的通用目的的科学和工程计算。‘ GPU 计算的模式'是在异类的计算模式下一起使用 CPU 和 GPU 。应用程序中精深复杂的计算和图形部分运行在 GPU 上,而简单的、连续的部分运行在 CPU 上。

NVIDIA Tesla 运算解决方案采用全球第一颗 teraflop( 万亿浮点八进制运算)多核处理器,促使运算行业迈进省电的并行运算时代。 1 个 Tesla GPU 处理器有 240 个核, 1 个 CPU 只有 4 个核。 1 台 Tesla S1070 1U GPU 超计算机含有 4 个 Tesla GPU 处理器,共有 960 个核,它提供了极强的并行运算性能,可支持并发执行数千个计算线程。可扩展的体系结构满足了许多复杂性超过了 CPU 处理能力的应用程序的计算需求。这样,就克服了全球运算市场最重大的挑战 —— 更快、更准确,满足高性能运算行业对性能无休止的追求。这些应用领域包括 : 地球科学、分子生物学、医疗研究、天体物理、基因排序、气象预报、电子设计自动化、分子动力学、量子力学、模式识别、立体视觉、电网调度和石油探测等等。其加速不是几倍,而是几十倍到几百倍。如 FFT (快速傅立叶变换)、稀疏矩阵的代数运算等。

美国有一计算中心,原有 1429 个 CPU 服务器,功耗 571kW, 投资 $ 5.98 M 。现在只要 25 个 CPU 服务器, 25 个 Tesla 系统,功耗 27kW ,投资只需 $ 0.36 M 。价格降低了 14 倍,功耗减少了 21 倍。

表 1 有关科学领域采用 Tesla GPU 处理器后工作加速的倍数
表 1 有关科学领域采用 Tesla GPU 处理器后工作加速的倍数

2 . CUDA 并行编程体系结构和模型

2.1 CUDA :可伸缩并行编程模型

图 1 为 CUDA 体系结构
图 1 为 CUDA 体系结构

Compute Unified Device Architecture (计算统一设备体系结构)是一种新型的硬件和软件体系结构,它将 GPU 作为数据并行计算设备,在 GPU 上进行计算和管理。 CUDA 体系结构可用于 Tesla 解决方案和一些 Quadro (视觉计算系统)的解决方案。支持 Linux 32 位 /64 位以及 Windows XP 32 位 /64 位 操作系统。操作系统的多任务机制负责管理多个并发运行的 CUDA 和图像应用程序对 GPU 的访问。 GPU 专用于解决数据并行计算(同一程序在许多数据元素上并行执行)和具有高运算密度(算术运算与内存操作的比例)的问题。数据并行处理将数据元素映射到并行处理线程。处理大型数据集合(比如数组)的许多应用程序就可以使用数据并行编程模型来加速计算。

《电子设计技术》网站版权所有,谢绝转载


上一页123下一页
?? ?? ??


打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

1.扫描左侧二维码
2.点击右上角的分享按钮
3.选择分享给朋友
?? ??

相关文章

我来评论
美国的游客
美国的游客 ??? (您将以游客身份发表,请登录 | 注册)
?
有问题请反馈