游侠NETSHOW论坛

标题: 普及知识:GPU流处理器 [打印本页]

作者: shu0202    时间: 2009-4-26 12:06:24     标题: 普及知识:GPU流处理器

       nVIDIA的下一代GPU刚刚被透露有512个流处理器,AMD的RV870就被透露有1200个处理单元。但是大部分了解GPU产品的人都知道,数字对比是没有意义的。为什么?因为数字背后的含义不同。
      
       进入DX10时代,为游戏图形渲染带来革命意义的顶点着色器和像素着色器被统一的一体化着色器代替并加入了几何生成这一步骤,这意味着以往由CPU描绘模型细节的步骤可以交给GPU来完成,顶点生成摆脱了性能较低的CPU的束缚,算是朝着电影CG级别的模型生成质量迈进了一步。但是一体化管线也带来一大问题,因为要做的事情比过去多了不少,所以管线内部变得更加复杂并且执行效率还要打折扣。NV的研究表明:最低要64条管线才能体现出一体化架构的运算优势(注意这里所说的管线是传统的向量管线而不是NV后来实际采用的标量管线)。一般来说,图形处理经常遇到的是2D、3D、4D这样的指令,所以已往的GPU管线都被设计成向量加法器和向量乘法器,以便于处理此类型的数据。比如NV一直采用3D+2D这样的管线结构,ATi则是4D+1D的管线结构。到了DX10时代,设计和制造64条这样管线的GPU是相当麻烦的事。R600就是这样的东西,晶体管数量和核心面积比前代增长了一倍,功耗也是大幅度提升。但是性能却不能令人满意。

       NV则是另辟蹊径,革命性的采用了1D标量架构,然后把图形指令拆分成1D标量形式进行运算。理论上说,这样的架构不存在硬件资源闲置的情况,效率最高。当然问题就是:每条管线的理论吞吐量只有传统的1/5而实际面积不会节省多少。NV的做法就是用128条管线外加大幅度独立提升流处理器频率来加强性能。这就是G80,空前庞大的GPU核心。AMD为了不在管线数量宣传上让别人看扁,所以就偷换概念,按以往标准的64管线再乘以代表4D+1D的5就变成了320条管线。而实际上因为4D+1D公用一个发射端,所以理论上每周期指令吞吐量仍是64条向量指令。另外R600是每16管线捆绑为一组只能执行同一类型指令,因此比较糟糕的情况下管线闲置率会接近50%,而平均利用率只有百分之七十。这样G80 VS R600就变成了128X1350X90% VS 64X5X80%X600X70%。R600必败无疑。

       当然决定GPU实际性能的不仅仅是管线,纹理单元、Z缓冲、色彩缓冲、光栅化但愿都相当重要,在RV770以前NV这些方面一直占据优势。
       RV770是AMD的转折点,他的实际管线增加到160条,整体运算单元增加到10组,后端规模都是翻倍提升。无论是运算能力还是效率都算是脱胎换骨。
       RV870设计1200sp,按照传统说法应该是240条向量管线,GT300设计512条标量管线。


[ 本帖最后由 shu0202 于 2009-4-26 12:07 编辑 ]
作者: 猩猩爱香蕉    时间: 2009-4-26 12:10:17

用4管线的路过。。。。。。。。。。。。。。。。。
作者: rex_pp    时间: 2009-4-26 12:13:20

这些东西都是厂商写出来骗人的,实际上一点用都没有,一般人学了更是没有,每一次dx版本升级都要求有新的硬件规格,在看看opengl,仅仅通过驱动就可以,如果仔细研究ms的技术文档,你会发现dx9c到dx10所谓的效率提升其实是指的游戏程序员可以更轻松的设计游戏,而玩家就是为了让程序员更轻松花钱买硬件
作者: 银魂天诛    时间: 2009-4-26 12:14:50

08.模拟器、硬件、TV、PT帖
关闭或移动到专区并做出警告,屡教不改者禁言一周;
已举报
作者: maizhuo    时间: 2009-4-26 12:15:06

等这帖被版主转到硬件区再来讨论
作者: socket9999    时间: 2009-4-26 12:21:57

原帖由 rex_pp 于 2009-4-26 12:13 发表
这些东西都是厂商写出来骗人的,实际上一点用都没有,一般人学了更是没有,每一次dx版本升级都要求有新的硬件规格,在看看opengl,仅仅通过驱动就可以,如果仔细研究ms的技术文档,你会发现dx9c到dx10所谓的效率提升其实是指的游戏 ...

我尿了
能不能不要胡扯。
11111111111111111111111111111
作者: little_gon    时间: 2009-4-26 12:24:19

这种帖子发在硬件区更合适吧~~~~~~~~~~~
作者: md00000000    时间: 2009-4-26 12:24:44

GT300的512SP现在还难说,因为40nm工艺现在并不成熟

AMD的RV870稍微现实一点,但会不会出现良品率过低也难说,良品率过低的结果就是成本增加,比如初期的GT200


现在是经济危机时期,购买力下降,尤其是高端显卡。。我觉得这次A和N都会延期。

PS:这帖子该发在硬件讨论区
作者: RocK.    时间: 2009-4-26 12:26:17

最近怎么总有普及版规的家伙???????
作者: kingoffright    时间: 2009-4-26 12:28:05

我也刚看到这个新闻,对这个流处理器恰好有点不懂~
作者: jsbbla    时间: 2009-4-26 12:55:45

看看我的GPU。。。。。。。。。。。。。。
作者: mango36    时间: 2009-4-26 13:04:50

头像不错.......发色有感觉..........

帖子扫盲也不错......
作者: whcwhc123    时间: 2009-4-26 13:15:40

用着4管 旁边800SP在盒子里睡觉的飘过
作者: 宅猫儿    时间: 2009-4-26 16:52:40

原来是这样····················




欢迎光临 游侠NETSHOW论坛 (https://game.ali213.net/) Powered by Discuz! X2