注册 | 登录

游侠NETSHOW论坛





游侠NETSHOW论坛 游侠NETSHOW论坛 游侠硬件信息交流发布区 GPU已经全面迫近了CPU!HD7970 vs GTX580,当物理学家“ ...
查看: 8652|回复: 34
打印 上一主题 下一主题

[原创] GPU已经全面迫近了CPU!HD7970 vs GTX580,当物理学家“费米”来到一个叫“南方群岛”的地方 [复制链接]

帖子
45
精华
0
积分
33
金钱
342
荣誉
1
人气
0
评议
0
跳转到指定楼层
楼主
发表于 2012-2-23 19:06:57 |只看该作者 |倒序浏览

之前被AMD所谓的4VLIW 6900欺骗了感情之后,终于在HD7900的南方群岛发现了她的美丽。性能强悍已经毋庸置疑,不过我还是看到小小的不足,HD7900好像只为了战地3等少数游戏优化,对于一些更加常规的游戏来说,也看到了7900新架构的水土不服。
关于7900和NV上代旗舰580的3D性能对比相信大家都很清楚,下面为同学们解刨这种截然不同的性能架构对比。7900改进有两大方向,3D性能这是不用说了,堆砌起来的流处理器单元,如果性能不强就要见鬼去了。另外,就是架构的更新,其实可以更加确切地说,架构的优化更多可以从通用运算的不同算法测试 中表现出来。

通用运算标准CUDA、ATIstream、OpenCL、DirectCompute
以下是为大家进行一些常规的通用计算“科普”,接着就是GTX580和HD7970的通用运算性能对比。显卡通用运算很早就被提出,原因是因为GPU有强大的运算能力,而且远远高于同一时期的CPU性能。因此,人们就想方设法去释放GPU在3D渲染以外的性能。

CUDA是NV提出的一个通用计算体系,也是最早的体系。全称 Compute Unified Device Architecture,统一计算架构。ATIstream是基于2900XTX硬件而生的,而OpenCl则是苹果提出的一个通用运算标准它属于开放标准。同样,微软在在操作系统的基础上也提出了DirectCompute的标准。
可以看出,CUDA以及ATIstream(也叫APP技术)和硬件的相关性较大,它们分别来自于NV和AMD,所以在自己的设备上才可以很好的运行。不过OpenCL以及Directcompute是开放标准,因此N和A卡同样运行。下面的测试是基于相同的体系进行对比。分别采用OpenCL和DirectCompute测试。

上面说明的是AMD app转码技术,Atistream技术把GPU变成一个并行处理器。

NV的通用技术方面是基于CUDA体系来支持OpenCl,DirectCompute11(DX11计算)。同样的原理,A卡是通过APP技术来支撑OpenCl等。

ATIstream和CUDA一样,可以写一次,就可在不同代的设备中使用。譬如在HD5870可以在HD6970上运行。譬如在8800GTX写的CUDA程序,可以在GTX580上运行。


CUDA现在可以发展的异构运算,可以通过CUDA-X86或其他编译器

AMD最新的GCN架构有两个巨大的改变,一是几何性能的增强,另外就是通用运算的加强。个人感觉GCN名字起得够呛的。N是神马?Next嘛,Next之后呢?还是Next,这不是废话吗。看看架构方面GCN的每个基本单元是4VLIW,和Fermi有很大不同,不过两者在架构争强的改进却如出一辙,就是增加了读写统一的高速二级缓存。

这是Fermi的架构改进。可以看到加多了L2外,比AMD架构优胜的是增加了SM和L1单元。这让Fermi核心更像是一个CPU一样智能。

Fermi架构采用了是多层次的组织,广义来说Fermi已经接近MIMD架构。(多指令,多数据流)

AMD一个基本单元具备4个运算器,分支器,和寄存器。AMD的最基本单元也是个SIMD单元。这种架构对算法,软件的依赖性非常大。

Win7 DirectCompute的工作模式
下面是HD7900和GTX580的DirectCompute测试

通过Gpu来模拟1048576个粒子之间的物理作用,每个粒子有自己的纹理。考验GPU的多线程效能。

GTX580性能一定程度上占优。

通过DirectCompute为接口,让GPU处理图片。首先通过GPU的3d模式渲染好图片,然后再通过Gpu通用运算的能力对此图片进行处理。

两者性能相当,HD7970没表现出任何优势。

以上是海洋波浪仿真,通过DirectCompute来实现傅里叶变换,用此来模拟海洋波浪。渲染采用DX10API做模型渲染。

GTX580在此波模拟测试中全面占优。

DC来模拟N体,此场景一般用于天文学的天体力学模拟。测试可以调节不同物体的数量。

此测试7970终于在1w以上的粒子模拟测试中表现出优势。

下面是OpenCL通用运算大PK

如果你学过图像处理,相信你对上面的图片影响深刻,说说题外话,图中的女主角是N年前某某大杂志的女郎。至于阴差阳错地成为了当年某某技术宅男为验证图像算法的照片,就可以让人想到,技术宅也是正常人莱迪。。。。。

盒子滤波一般用来去噪点,它是比较粗糙的一个算法。它实现的实质是考验显卡矩阵乘法的性能,可以看出具备L1,和SM单元的Fermi核心有较大优势。

Sobel滤波测试,这些处理一般用于图像的边缘检测,是图像增强的一个方面,可以用在地形识别等多个领域。可以看出处理过的图片表现出明显的轮廓。一般3D游戏上也会采用此技术来配合抗锯齿。

GTX580表现出微弱的优势。

此测试和之前的N体模拟一样,不过本次测试采用的是OpenCL实现。
GTX580同样有一点优势,不过优势不大。

中值是最简单的图像滤波,主要是去掉一些信号的干扰。

测试性能两者相差不大

密闭空间的刚体模拟,模拟数万粒子在一个空间内容碰撞情况。可以看到类似的模拟GPU表现出很大优势,因为每个GPU具备几百到上千的计算单元,运用显卡并行的优势可以释放显卡巨大的潜能。这些模拟在一般4,8核处理器上是不敢想象的。

由于通用算法的兼容性或者架构问题,HD7970在此测试中性能大幅落后。而GTX580表现出较为强悍的性能。

熟悉PS的同学应该熟悉高斯模糊,不过PS是通过CPU实现,本次测试是通过GPU来实现。高斯模糊可以在3D游戏中制造景深等特效。

GTX580一如既往地领先于HD7970.


总结:从测试数据来看,HD7970已经比较接近GTX580的性能,当然Fermi采用了更高层次的存储器结构从而保持着一定的优势。可以看出,AMD在通用计算中的决心。看看之前某某大学采用HD5870,6870那些产品而不忍睹的通用性能来说,HD7970算是一个比较大的进步。不过话说回来,我还是比较期待开普勒的性能到底会提升到那种程度!!!

附件: 你需要登录才可以下载或查看附件。没有帐号?注册
已有 1 人评分金钱 收起 理由
HEROYOURS + 30 感谢分享~

总评分: 金钱 + 30   查看全部评分

使用道具 举报

帖子
45
精华
0
积分
33
金钱
342
荣誉
1
人气
0
评议
0
沙发
发表于 2012-2-23 19:08:08 |只看该作者
有疑问一律明天下午来解决 有不懂的欢迎提问

使用道具 举报

天使
AMD Tahiti XTL R9 280X

白金会员勋章活跃勋章

帖子
21066
精华
1
积分
11168
金钱
5122
荣誉
24
人气
1819
评议
12

板凳
发表于 2012-2-23 19:14:50 |只看该作者
不太懂。。
这就是相当于让A卡跑PhysX么?

使用道具 举报

白金会员勋章活跃勋章人气勋章·初级

帖子
55994
精华
0
积分
28691
金钱
171979
荣誉
59
人气
576
评议
0
地板
发表于 2012-2-23 19:17:43 |只看该作者
LSD精辟啊! {:00:}

使用道具 举报

帖子
45
精华
0
积分
33
金钱
342
荣誉
1
人气
0
评议
0
5#
发表于 2012-2-23 19:19:36 |只看该作者
a451629412 发表于 2012-2-23 19:14
不太懂。。
这就是相当于让A卡跑PhysX么?

不是 说的是南方群岛开始有点进步了,GPU已经开始向CPU方向发展了 这是个好兆头

使用道具 举报

天使
AMD Tahiti XTL R9 280X

白金会员勋章活跃勋章

帖子
21066
精华
1
积分
11168
金钱
5122
荣誉
24
人气
1819
评议
12

6#
发表于 2012-2-23 19:31:44 |只看该作者
驱剑侠er 发表于 2012-2-23 19:19
不是 说的是南方群岛开始有点进步了,GPU已经开始向CPU方向发展了 这是个好兆头 ...

但还是落后于费米。。。。 [害怕]

使用道具 举报

银河究极星爆
游侠元老版主
『PC游戏综合区』
VEGAS☆龙之旋风の870MCS
医院骑士团教士
★★★★★★★★★

2014年优秀版主勋章元老版主勋章版主勋章资深版主勋章勤劳之证

帖子
9646
精华
2
积分
5520
金钱
86395
荣誉
27
人气
266
评议
6

7#
发表于 2012-2-23 19:46:15 |只看该作者
其实俺感觉amd就输在软件上了。。。。

使用道具 举报

帖子
83
精华
0
积分
52
金钱
551
荣誉
1
人气
2
评议
0
8#
发表于 2012-2-23 19:58:20 |只看该作者
我觉得GPU目前还是没有办法超越CPU的

使用道具 举报

帖子
83
精华
0
积分
52
金钱
551
荣誉
1
人气
2
评议
0
9#
发表于 2012-2-23 20:02:47 |只看该作者
我觉得GPU目前还是没有办法超越CPU的

使用道具 举报

帖子
1899
精华
0
积分
990
金钱
5687
荣誉
4
人气
4
评议
0

10#
发表于 2012-2-23 20:11:39 |只看该作者
太高端了看不懂{:2:}

使用道具 举报

帖子
72
精华
0
积分
36
金钱
499
荣誉
0
人气
4
评议
0
11#
发表于 2012-2-23 20:34:40 |只看该作者
7970 很让人失望。

使用道具 举报

帖子
2213
精华
0
积分
1117
金钱
3461
荣誉
1
人气
1
评议
0
12#
发表于 2012-2-23 20:35:39 |只看该作者
AMD让人很失望
身为穷B,真tm希望末日是真的。

使用道具 举报

帖子
23
精华
0
积分
12
金钱
193
荣誉
0
人气
0
评议
0
13#
发表于 2012-2-23 22:28:36 |只看该作者
我还是比较看好NV的通用技术的。

使用道具 举报

帖子
1476
精华
0
积分
744
金钱
9993
荣誉
0
人气
17
评议
0
14#
发表于 2012-2-23 22:36:32 |只看该作者
{:00:}看不懂,不过我感觉AMD的目标不是让GPU做CPU的工作这么简单,现在能看到的只是推掉了土而已,不知道下一步地基会怎么打

使用道具 举报

帖子
1190
精华
0
积分
595
金钱
1135
荣誉
0
人气
4
评议
0
15#
发表于 2012-2-23 22:37:50 |只看该作者
其实CPU跑的也很快,GPU计算虽然快,但是带宽开销也大,不划算

使用道具 举报

帖子
43
精华
0
积分
22
金钱
368
荣誉
0
人气
5
评议
0
16#
发表于 2012-2-23 22:38:34 |只看该作者
那么高端的卡我可用不起,也不感兴趣。。。。。

使用道具 举报

帖子
55
精华
0
积分
28
金钱
314
荣誉
0
人气
0
评议
0
17#
发表于 2012-2-24 00:20:32 |只看该作者
目前来说GTX580更有优秀,就不知道两个超频后哪一个更强。

使用道具 举报

帖子
5354
精华
0
积分
2690
金钱
11803
荣誉
1
人气
28
评议
0
18#
发表于 2012-2-24 11:03:52 |只看该作者
看价钱就知道了,顶级家用CPU不过2-3k,顶级显卡可以4-5k,功耗也比CPU高

使用道具 举报

国际米兰 最佳新人
魏 虎豹骑

白金会员勋章活跃勋章

帖子
21461
精华
0
积分
11432
金钱
339
荣誉
70
人气
12
评议
0

19#
发表于 2012-2-24 13:34:26 |只看该作者
真心看不懂啊           

NerazzurriIo vi seguiro
NerazzurriSempre li vivro
NerazzurriQuesta mia speranza
E l’assenza
Io non vivo senza!!!
选自《PAZZA INTER

使用道具 举报

帖子
844
精华
0
积分
423
金钱
3055
荣誉
0
人气
5
评议
0
20#
发表于 2012-2-24 14:02:07 |只看该作者
看不懂,我等用户只看游戏帧数。

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

手机版|Archiver|游侠NETSHOW论坛 ( 苏ICP备2023007791号 )

GMT+8, 2025-9-20 18:32 , Processed in 0.422265 second(s), 13 queries , Gzip On, Memcache On.

Powered by Discuz! X2

© 2001-2011 Comsenz Inc.

分享到