注册 | 登录

游侠NETSHOW论坛





游侠NETSHOW论坛 游侠NETSHOW论坛 游侠硬件信息交流发布区 intel也没那么神嘛?Intel Atom高分真相
查看: 1985|回复: 4
打印 上一主题 下一主题

[转贴] intel也没那么神嘛?Intel Atom高分真相 [复制链接]

帖子
295
精华
0
积分
150
金钱
2652
荣誉
0
人气
7
评议
0
跳转到指定楼层
楼主
发表于 2013-7-13 18:28:10 |只看该作者 |倒序浏览
本帖最后由 a451629412 于 2013-7-17 12:16 编辑

泡泡网CPU频道7月13日 第三方调研公司ABI Research以安兔兔成绩盛赞Intel Atom处理器性能超过高通、三星一事其实是5月中发生的,今天EETimes上篇博文又谈到了这件事,认为ABI只用安兔兔成绩说事有些武断,他又列举了其他评测项目的成绩来反驳,并认为安兔兔从2.9.3版到3.x的评分机制变化导致Intel处理器得分大幅上升,所以才占到了优势。

   没想到这件事并没有结束,既然双方争论的焦点是安兔兔软件,Anandtech论坛上就有一位爱较真的网友(应该是个程序员或者开发者)分析了安兔兔软件,结果却让人很震惊,他认为安兔兔有故意为Intel处理器优化甚至使用对ARM不公平的方式了评分。

   如果此事成真,那么安兔兔的节操就要洒满一地了。

   下面来看一下他的分析。

   安兔兔是怎样的一个程序

   首先是解包安兔兔程序,APK程序实际上就是一个标准的ZIP压缩文件,这一步没什么难度。解包后在lib库中发现了X86和ARM-v7a目录,分别对应Intel和ARM处理器。然后再解包libabenchmark.so文件,他用的是objump软件。

   下面就来理解一下安兔兔软件的根基了,原文作者从解包出来的文件中发现安兔兔实际上就是nbench,因为二者的功能及函数之类的东西都是一样的,我们可以说安兔兔的CPU整数和浮点测试都是基于nbench的,后者的源码地址在http://www.tux.org/~mayer/linux/bmark.html。(原来安兔兔的测试部分不是自己开发的,也开源程序DIY的啊)

   现在继续我们的目的,揭开为啥安兔兔3.x测试中Intel处理器跑分这么高的原因。之前EETimes一文质疑的原因就是在于从2.9.3版升级到3.0之后,Atom处理器总分及内存测试分别提升了122%、292%,而三星Galaxy S4只提升了53%、59%,这其中的区别耐人寻味。

   Atom超高跑分第一个疑凶:编译器

   找出的第一个“疑凶”是编译器,安兔兔针对X86使用的是ICC编译器,这是一种公认的高质量矢量化编译器,而矢量化恰恰是ARM处理器不擅长的,因为后者缺少整数NEON指令。

   安兔兔针对ARM处理器使用的是GCC编译器,而且也不支持ARM的NEON指令,因为存在着Tegra 2这样早起的处理器不支持NEON指令的情况,但是现在来看这些不是理由,NDK中使用独立代码支持NEON指令不是难事,这也是Google的文档中标准的开发范例。

   令人奇怪的就是安兔兔不按照Google的开发范例支持原本应该支持的功能,却对不属于NDK标准支持之内的ICC编译器青睐有加。

   编译器的问题只是一个开始,下面还有更精彩的,它们的作用甚至比编译器更“出色”。

   第二疑凶:代码优化

  Nbench测试时会检查CPU是怎样执行简单的按位操作的,包括shift位移、and加、or或等,为了执行这些,它会在内存载入一系列bit,每次载入一个,具体的代码如下:

   再来看ARM和X86是如何具体执行的。

   ARM处理器执行的代码

   X86执行的代码

   X86上的代码在做的是讲整个32bit运行到0或者1,其中的f64c3和f64c6是关键。它用这两个指令取代了ARM循环中的32次迭代。这个的作用就不需多说了,X86用这种方式获得了十多倍的运行速度提升。

   这种做法打破了整个测试过程。当编译器本来打算用一些被测试程序认定为正确的操作来提升测试程序的性能时,它实际上并没有执行真正的测试程序功能。典型的例子就是如果结果没有被读取,它就省去了代码,或者是在输入数据被认为是常量时,它可以将原本需要的运行时间缩减到只需编译时间即可。

   在这种情况下Intel肯定会宣称这是他们正当的优化而已,但是原文作者不赞同,认为这种优化很难被当做正常的代码,用处也很有限,因为没谁会用这样的代码来执行。这种伎俩更应该被认为是一种作弊,因为当运行长度不是非常大的时候它甚至会更慢。

   更重要的是,这种优化是在最近的一次版本升级中才出现在ICC中的,作者不认为他们是最近才发现了这种优化的价值,更可能的情况是他们发现这种优化可以数倍提升安兔兔分数,或者这也可以解释为什么最近曝光的下一代Atom处理器在1.1GHz频率下都能以4万的高分秒了2.3GHz的骁龙800了。

   我们简单归纳一下作者的观点和论据:Atom处理器跑分高有两个原因,一个是编译器的原因,X86使用的ICC编译器优化很好,而针对ARM所用的GCC编译器甚至都不能支持ARM的NEON指令。第二个就是安兔兔代码中,将X86运行测试程序的代码“优化了”,只需2个指令就能完成ARM处理器需要进行的32次迭代,但是这种优化对实际性能没有好处,这种反常的设计颇有寻味之处。

   原文最后把矛盾的焦点转向了安兔兔,因为他们默认了这样的性能提升,还认为安兔兔有可能是收钱了(probably for a price),不然这些反常的现象是没法解释的。

   Intel、ARM出面掀起新高潮

   原文的翻译差不多完了,因为是技术文章,个别语句可能把握的不够准,不过大体意思我们是知晓了的。我能这么早看到这篇文章其实是微博所赐,发这个链接的正是ARM移动市场经理王骏超EW,微博发出之后很快就有人回复,其中一个人则是Intel中国研究院首席工程师吴甘沙,看完Intel对ARM还是很关注的嘛,这让人想起了钱钟书说过的一句话:情敌之间的挂念有时候要比情人之间的牵挂还要多。

   王先生虽然发了链接,不过自己并没有说太多,但他显然是站在揭黑幕、维护ARM的立场上的,而吴先生也客气地解释了这个问题,他认为编译器也是架构竞争力的一部分,用ICC无可厚非,而且ARM的NEON指令是比不过Intel的SSE 4.x指令集的。他还认为原文的分析并不能解释Atom在安兔兔多数程序上的优势。

   总之,现在这件事已经多多少少地从媒体牵扯到了ARM、Intel两家公司出面了,而涉及最深的应该是安兔兔,目前还没有他们的表态,只是从这篇文章的分析来看,安兔兔不管有没有收钱,在这件事上都是有不光彩行为的。


已有 1 人评分金钱 收起 理由
a451629412 + 5 感谢分享~

总评分: 金钱 + 5   查看全部评分

使用道具 举报

帖子
305
精华
0
积分
154
金钱
3544
荣誉
0
人气
0
评议
0
沙发
发表于 2013-7-16 20:38:34 |只看该作者
安兔兔称,已经与ARM、三星、高通等所有芯片制造商建立了联系机制,虽然源代码不公开但有专业制造商监督,会把产品做得更好。



    关于此次ARM与Intel的争论,安兔兔表示已经接收到了制造商的通知,正在进行测试与修正,但需要一些时间。最近在中国地区和Google Play商店中接连发布的3.3.2版已经解决了这一问题。



    安兔兔称,这一事件源自其对V3标准的极限追求而使用了Intel编译器,但他们不会为任何一个制造商修改代码。



    安兔兔还将在8月13日发布全新的V4测试标准,“由一个极限回归到用户体验”,“将完全超越任何一个评测软件”。

使用道具 举报

天使
AMD Tahiti XTL R9 280X

白金会员勋章活跃勋章

帖子
21066
精华
1
积分
11168
金钱
5122
荣誉
24
人气
1819
评议
12

板凳
发表于 2013-7-17 12:34:13 |只看该作者
跑分作为一个参考就可以了。。。
实际性能还要看优化等等。。

使用道具 举报

帖子
7416
精华
0
积分
3722
金钱
16091
荣誉
0
人气
139
评议
0
地板
发表于 2013-7-17 15:04:34 |只看该作者
AMD能拿点干货吗 每次都是纸上东西说事  拉出来跑跑就是了
人生路漫漫.

使用道具 举报

帖子
9148
精华
1
积分
5028
金钱
12829
荣誉
25
人气
36
评议
0
5#
发表于 2013-7-17 18:56:55 |只看该作者
3dmark跑intel核显那还不是各种作弊……
游侠山寨水冷第一人?

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

手机版|Archiver|游侠NETSHOW论坛 ( 苏ICP备2023007791号 )

GMT+8, 2025-10-28 20:46 , Processed in 0.362167 second(s), 13 queries , Gzip On, Memcache On.

Powered by Discuz! X2

© 2001-2011 Comsenz Inc.

分享到