注册 | 登录

游侠NETSHOW论坛





游侠NETSHOW论坛 游侠NETSHOW论坛 游侠硬件信息交流发布区 原创分析:R600架构其实并不差
查看: 1976|回复: 13
打印 上一主题 下一主题

[原创] 原创分析:R600架构其实并不差 [复制链接]

帖子
2976
精华
1
积分
1800
金钱
2728
荣誉
11
人气
18
评议
0
跳转到指定楼层
楼主
发表于 2008-8-25 14:42:27 |只看该作者 |倒序浏览
也许对于HD2000系列,性能表现不怎么样,R600的成本也控制不好,AAAF性能也低下
但现在4000系列表现就好了,特别4800系列,一方面在R600系列基础上进行了一些改进,而且几乎是全面改进,但大体架构还是基于R600的。这次AAAF效率大大提高的一个原因是增强了ROP,另一个重要原因是Sharder单元的大幅增加,因为AAAF的运算靠的还是流处理器,所以原来由于Sharder还不够多,而现在基本处于富余的状态,所以会出现FreeAA的现象。另外就是AMD更好地压榨55nm的潜力,更大化地利用晶体管,尽可能缩小了核心面积,减少晶体管数量。至于为什么能从320个流处理器升到800个而晶体管只增加了2.9亿个,这主要是因为GPU里不是只有流处理器单元,RV770中的Sharder单元只占了约30%的核心面积(下面有图),所以大幅增加Sharder不会带来巨大的晶体管数量提升,其他的单元基本相对RV670没多少扩充,而是效率上的改进。所以这其实是在挖掘R600架构的潜力,更好地利用了这种架构的优势,所以R600的这种架构并不叫废,只是原来不能很好地利用,Sharder还不够多,而且也保留了R5系列的3:1的架构,1D+4D架构也有助于提升浮点运算能力。

RV770核心示意图


[ 本帖最后由 mawen1250 于 2008-8-25 14:59 编辑 ]

使用道具 举报

帖子
2976
精华
1
积分
1800
金钱
2728
荣誉
11
人气
18
评议
0
沙发
发表于 2008-8-25 14:52:57 |只看该作者

泡泡网的有关内容

● RV770核心架构图:

    基本上,RV770和RV670的整体结构是相同的,RV670身上所有的模块都得到了沿用,但很多模块都经过了重新设计或者优化设计:

1。SIMD阵列扩充为10组,每组SIMD绑定专属缓存及纹理单元;

2。纹理单元数量扩充为10组,寄存器容量增加;

3。继续提升几何着色的效率,适应未来DX10游戏的需要;

4。改进可编程镶嵌单元,使之更适合于动画游戏实时渲染;

5。改进显存控制器,率先支持GDDR5,并加入显存读写缓冲区,增强数据读写命中率。

● RV770核心规格全面翻倍:

    翻倍的规格是最容易理解的,但数字部分往往比较抽象,下面就详细介绍各个模块的具体含义。

    RV770核心最显著的特点就是将流处理器提升到了空前的800个,达到了RV670的2.5倍!实际上除了流处理器之外,纹理单元、光栅单元都得到了大幅增强。

● 流处理器翻2.5倍:


    RV670是4组SIMD,每组16个Shader,每个Shader 5个流处理器

    RV770是10组SIMD,每组16个Shader,每个Shader 5个流处理器

    在SIMD和Shader规模扩大的同时,Ultra-Threaded Dispatch Processor(超线程分配处理器)也变得更加复杂。由于每组SIMD所包括的Shader数量增多,阵列内的Arbiter(仲裁器)和Sequencer(定序器)数量同比增加至20个,因此扩充规模后的RV770单个Shader执行效率并不会下降。

● 纹理单元翻2.5倍:

    RV770的纹理单元数量相比R600/RV670翻了2.5倍,从4组增加至10组,这样RV770总共就是40个纹理单元,Shader和TMU的比例达到了4:1。

    每组纹理单元内部包含了4个纹理寻址单元(黄色,共40个),16个32位浮点纹理采样单元(橘黄色,共160个),和4个纹理过滤单元(深红色,共40个)。
● 光栅单元数量不变,规格翻倍:
    RV770还是保持4组后处理单元,也就是通常所说的16个。但这次AMD重新设计了光栅单元的内部结构,以改善R600/RV670那低下的AA效能。




    R600/RV670每组后处理器单元内部包括了8个Z/模版采样,而RV770将采样数量提高至16个,多重采样(MSAA)速度直接翻倍,AMD声称RV770可以提供几乎免费的2xMSAA效能,并且4x/8xMSAA效能相比上代提升非常显著。
    RV770的AA算法最终还是交给Shader部分来处理,好在RV770的流处理器高达800个,多数情况下都处在性能过剩状态。2倍的Z/模版采样率再加上2.5倍的Shader规模,RV770的抗锯齿性能将会有一个质的飞跃

   RV770核心不仅仅是把核心各个模块的数量翻倍这么简单,实际上在微架构方面还做了不小的优化,这方面相信很多朋友还不容易理解,下面就做一个简单的说明。
● 压缩晶体管密度,每平方毫米晶体管性能提升40%

    在GPU最关键的流处理器部分,RV770与RV670的结构是完全相同的,RV670拥有4组SIMD(每组SIMD包括16个Shader,每个Shader有5个流处理器),RV770是10组SIMD,可以说在流处理器部分只是单纯的扩充了规模。不过,这次ATI通过另外一种“投机取巧”的方式提高了RV770核心的“效能”——压缩晶体管,或者说是提高硅片的利用率。


同为55nm工艺,RV670和RV770的SIMD阵列所占体积不同

    通过上图就可以看出,从RV670到RV770,每组SIMD阵列所占用的芯片面积缩小了40%,如此一来每平方毫米晶体管所能提供的性能就提高40%。在架构和结构不变的情况下,能获得如此巨大的性能提升,看来AMD对于55nm工艺的运用已经达到了炉火纯青的地步!



RV770核心各部分模块示意图

    现在我们就可以理解,同为55nm工艺,为什么7.54亿晶体管的G92核心面积高达230平方毫米,而9.56亿晶体管的RV770核心面积只有256平方毫米!因为RV770的晶体管密度更大,G92b作为NVIDIA首颗55nm的GPU,看来晶体管密度还不够高,没有充分利用硅片面积。



RV770核心晶元切割示意图


    减少芯片面积的优势是不言而喻的,意味着一块晶元上能切割出更多的GPU核心,这样制造成本就会下降。当然与成本息息相关的还有芯片良品率的问题,RV770的晶体管密度如此之高,可能会影响良率,而且发热过于集中的问题会比较棘手。


● 纹理单元全新的缓存设计

    前面已经提到RV770相比RV670纹理单元的数量翻了2.5倍,在数量增加的同时,一二级缓存的容量和带宽都随之改进,以确保存取效率。

  • 顶点着色拥有独立专署缓存
  • 每一组SIMD阵列拥有单独的一级缓存(L1 TC)
  • RV770核心相比RV670,L1 TC容量翻倍,总L1容量达RV670的五倍!
  • 在显存控制器和显存颗粒之前拥有二级缓存
  • L1纹理缓存存取速度高达480GB/s
  • L1和L2缓存之前的带宽高达384GB/s
● 抗锯齿效能翻倍:

    在之前HD4850的评测中我们已经发现,其AA效能大幅超越HD3870,和9800GTX/+相比也能够反败为胜,而且AA等级越高优势就越明显!

    可以看出,全新的ROP单元大大加强了RV770核心的多重采样效能,如果不开AA那么RV770就没什么优势,一旦打开2x/4x/8xAA,那么它惊人的实力就会被完全释放出来。
     由于目前玩家们对游戏画质的要求很高,抗锯齿基本上成为了每个游戏的默认特效,再加上目前高端显卡的实力够强,在打开AA的情况下都有不错的FPS,因此4xAA应该是基本配置,更何况微软已经将4xMSAA列为DX10.1的默认标准,所以高端显卡的性能应该以打开4xMSAA为准。

使用道具 举报

帖子
1188
精华
0
积分
594
金钱
3716
荣誉
0
人气
0
评议
0
板凳
发表于 2008-8-25 14:54:12 |只看该作者
ATI怎么不聘用你
[支持] [支持]
i7 920   OC 4.0 黑虎鲸金尊版
微星x58 pro-e(穷人的x58)
威刚游戏威龙 DDR3 1333 2g*2(一条290买的,一条360买的!)
索泰 GTX260+ 首发版(拿去修了,现在用二奶的8800gt)
COOLER MASTER 特警334
TT kk500A(垃圾电源)
键盘 黑腹狼蛛镜面特别版
鼠标 炼狱蝰蛇
垃圾显示器没脸说

使用道具 举报

GTA☆Mafia-Angel
游侠特级DIYER

大头像勋章

帖子
6028
精华
0
积分
3172
金钱
19136
荣誉
13
人气
261
评议
0

地板
发表于 2008-8-25 14:55:13 |只看该作者
但觉得SHARDER的频率与核心频率一样显得有点跟不上N的X2.5步伐~~

使用道具 举报

帖子
2976
精华
1
积分
1800
金钱
2728
荣誉
11
人气
18
评议
0
5#
发表于 2008-8-25 14:58:13 |只看该作者

回复 #4 WhiteHouse 的帖子

这就是各有各的了,NV有频率异步,ATi有1D+4D单元,NV想着怎么样提高异步倍数,ATi想着怎么样提高流处理器效率。

使用道具 举报

帖子
2976
精华
1
积分
1800
金钱
2728
荣誉
11
人气
18
评议
0
6#
发表于 2008-8-25 15:01:55 |只看该作者
另外要说的是,ATi为了扩充纹理单元数量,改变了绑定模式,是和显存位宽绑定的,也就是256bit就对应了16个纹理单元,而现在改变了绑定模式变为40个,但其实单个效率下降了不少,一定程度上算是一种退步。

使用道具 举报

GTA☆Mafia-Angel
游侠特级DIYER

大头像勋章

帖子
6028
精华
0
积分
3172
金钱
19136
荣誉
13
人气
261
评议
0

7#
发表于 2008-8-25 15:25:16 |只看该作者
真怀疑LZ你是不是在ATI 逃出来的......这么熟悉这架构的呢~

使用道具 举报

帖子
9148
精华
1
积分
5028
金钱
12819
荣誉
25
人气
36
评议
0
8#
发表于 2008-8-25 15:25:37 |只看该作者
看似很强大,所以顶一个20202020202020
游侠山寨水冷第一人?

使用道具 举报

常盘台ACE☆御坂美琴
Only My Railgun

大头像勋章活跃勋章荣誉勋章特色头衔勋章人气勋章·高级人气勋章·初级综合区荣誉会员勋章

帖子
207573
精华
1
积分
110905
金钱
335433
荣誉
439
人气
25289
评议
0

9#
发表于 2008-8-25 16:29:16 |只看该作者

回复 #7 WhiteHouse 的帖子

LZ是A FAN,在硬件区每一贴都是褒扬A卡的。。。

使用道具 举报

帖子
1319
精华
0
积分
671
金钱
1278
荣誉
1
人气
12
评议
0
10#
发表于 2008-8-25 18:12:12 |只看该作者
单单硬件架构先进还并不能取得完美表现,要有软件的相辅相承才能获得众人认可。
AMD显卡的缺点就是驱动做得不好,如果这点加以改进,相信会有质的飞跃。
塞翁失马  焉知非福

使用道具 举报

帖子
2976
精华
1
积分
1800
金钱
2728
荣誉
11
人气
18
评议
0
11#
发表于 2008-8-25 19:20:43 |只看该作者

回复 #7 WhiteHouse 的帖子

那CHH里的很多人都是从ATi里逃出来的了,我也只不过现学现卖,很多都是从CHH那看来的。

使用道具 举报

帖子
2944
精华
0
积分
1603
金钱
2642
荣誉
13
人气
0
评议
0

12#
发表于 2008-8-25 20:40:22 |只看该作者
CHH菜鸟别去,一没你说话的份,二你到那很多你都看不懂

FOREVER

使用道具 举报

帖子
2976
精华
1
积分
1800
金钱
2728
荣誉
11
人气
18
评议
0
13#
发表于 2008-8-25 23:41:01 |只看该作者

回复 #12 ppwen 的帖子

那就永远只能当菜鸟了?
混熟了就能说话了,何况有水区。

使用道具 举报

帖子
3408
精华
0
积分
1717
金钱
15002
荣誉
1
人气
27
评议
0
14#
发表于 2008-8-25 23:48:30 |只看该作者
看完全文没发现有说r600架构不差的,都是在说r770如何如何好...............

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

手机版|Archiver|游侠NETSHOW论坛 ( 苏ICP备2023007791号 )

GMT+8, 2025-7-7 11:59 , Processed in 0.418788 second(s), 12 queries , Gzip On, Memcache On.

Powered by Discuz! X2

© 2001-2011 Comsenz Inc.

分享到