注册 | 登录

游侠NETSHOW论坛





游侠NETSHOW论坛 游侠NETSHOW论坛 游侠PC游戏综合讨论区 ARM CPU的浮点运算上万分了,突然想到,CPU浮点强有啥用 ...
查看: 20663|回复: 37
打印 上一主题 下一主题

[讨论] ARM CPU的浮点运算上万分了,突然想到,CPU浮点强有啥用啊 [复制链接]

帖子
5593
精华
0
积分
2801
金钱
11389
荣誉
0
人气
46
评议
0
跳转到指定楼层
楼主
发表于 2013-9-5 19:23:45 |只看该作者 |正序浏览
浮点运算不是该交给显卡么,CPU这方面过得去就行了,没想到ARM的浮点性能居然比整数几乎高出一倍,这节奏是不是出错了啊

使用道具 举报

(,,Ծ‸Ծ,,)
游侠资深版主
『动作游戏区』
水晶圣斗士

2014年杰出版主勋章版主勋章资深版主勋章白金会员勋章活跃勋章勤劳之证

帖子
16243
精华
0
积分
9716
金钱
7059
荣誉
122
人气
3742
评议
15

38#
发表于 2013-9-7 20:24:34 |只看该作者
嗯,不懂,用英特尔加英伟达的飘过

使用道具 举报

帖子
378
精华
0
积分
191
金钱
3521
荣誉
0
人气
4
评议
0
37#
发表于 2013-9-7 20:16:08 |只看该作者
welo010 发表于 2013-9-7 18:48
我的意思是:以目前的浮点性能来看,无论是游戏还是什么别的,都是极大的浪费,性能是极其过剩的,反而功 ...

整数方面,A15对应A9的提升也是有的,比如加入了硬件除法器。而且指令拾取和执行方面的提升也直接影响到整数性能。不过这方面当然提升小确实是事实。

使用道具 举报

帖子
5593
精华
0
积分
2801
金钱
11389
荣誉
0
人气
46
评议
0
36#
发表于 2013-9-7 18:51:52 |只看该作者
qingke 发表于 2013-9-7 16:15
所谓消费级用不上那是自己骗自己

这不过常见的是自己设一个悖论,由他人反驳自己辩解而已

反着来说,你不也是自己安慰自己么,一天两充莫非很爽?白白浪费的电量完全用在了根本用不到的地方,有时间堆浮点搞服务器,还不如多堆点整数,稳固消费市场

使用道具 举报

帖子
5593
精华
0
积分
2801
金钱
11389
荣誉
0
人气
46
评议
0
35#
发表于 2013-9-7 18:48:06 |只看该作者
ksd 发表于 2013-9-7 15:48
“而且堆核才更需要改进算法,让原来只能用到一个核的任务拆开平均分配下去”这是我的第二段第一句的原话 ...

我的意思是:以目前的浮点性能来看,无论是游戏还是什么别的,都是极大的浪费,性能是极其过剩的,反而功耗上去了不少,与其堆浮点,还不如把部分功耗对应堆在提升整数上面,A15目前来说还没有什么软件是可以发挥它的浮点性能的,而整数性能却又不足

使用道具 举报

帖子
1988
精华
0
积分
1006
金钱
4083
荣誉
1
人气
15
评议
0
34#
发表于 2013-9-7 16:15:36 |只看该作者
welo010 发表于 2013-9-7 10:34
但是堆太高没意义啊,想堆高,芯片面积和功耗都会上去,得不尝试,要不A15怎么功耗会这么高,全是堆浮点 ...

所谓消费级用不上那是自己骗自己

这不过常见的是自己设一个悖论,由他人反驳自己辩解而已

使用道具 举报

帖子
1241
精华
0
积分
621
金钱
7613
荣誉
0
人气
1
评议
0
33#
发表于 2013-9-7 16:12:05 |只看该作者
看来还是有懂的~~

使用道具 举报

帖子
378
精华
0
积分
191
金钱
3521
荣誉
0
人气
4
评议
0
32#
发表于 2013-9-7 15:48:12 |只看该作者
welo010 发表于 2013-9-7 08:34
请稍微了解一下服务器软件部分关键在哪里,不要乱放炮,你根本就是说多少错多少----说算法。稍微了解一下 ...

“而且堆核才更需要改进算法,让原来只能用到一个核的任务拆开平均分配下去”这是我的第二段第一句的原话,指的是对于cpu堆核来讲的。服务器超算什么的是后来加的,没有另起一段外加“正是如此”让你理解成超算服务器需要“平均分配”是我的错。

回到帖子的主题。不能否认如果只是上上网,看看视频什么的A15完全就是浪费,但对于游戏,图片处理,音频处理,界面特效都很重要。而这恰好是手机都要用到的。有些可以使用GPU完成加速,但一方面想使用GPU需要单独编程,另一方面不管是移动还是传统GPU也没有一个成熟统一的标准来做这件事。而且很多任务(关联性较强的,需要快速返回结果的)用GPU反而不如CPU。所以还是需要增强CPU的浮点能力。但单纯的堆核并不能很好的提升实际的性能,所以CPU提升浮点任务的性能主要还是靠改进FPU方面。以ARM为例,A8加入NEON支持向量运算,A9VFP升级为流水线,A15位宽128Bbit原生支持FMA。另外指令处理方面的改进也能间接增强浮点任务的处理能力。

vfp在A15中的比重并不算大,和加长流水线,取指能力提升,缓存增大带来的晶体管数量上升相比,VFP的影响并不是决定性的。A15功耗高也与ARM对半导体工艺进展过分乐观有关。总之将A15功耗高归结为提升浮点能力是偏颇的。另外对于手机,A15提升浮点还是有用的,支持硬件虚拟化和地址扩展才是瞄着服务器市场完全没用的东西。

使用道具 举报

帖子
5593
精华
0
积分
2801
金钱
11389
荣誉
0
人气
46
评议
0
31#
发表于 2013-9-7 10:34:45 |只看该作者
qingke 发表于 2013-9-7 09:23
现在很多程序都会进行小数计算,这个时候就是浮点体现价值的时候了

但是堆太高没意义啊,想堆高,芯片面积和功耗都会上去,得不尝试,要不A15怎么功耗会这么高,全是堆浮点堆出来的,完全就是照着服务器市场去设计,消费级不但用不上,还影响体验

使用道具 举报

白金会员勋章活跃勋章资深水手勋章游侠之星

帖子
14917
精华
0
积分
7683
金钱
79894
荣誉
15
人气
737
评议
0
30#
发表于 2013-9-7 09:40:10 |只看该作者
這玩意絕不是這麼簡單的~

使用道具 举报

帖子
1988
精华
0
积分
1006
金钱
4083
荣誉
1
人气
15
评议
0
29#
发表于 2013-9-7 09:23:56 |只看该作者
现在很多程序都会进行小数计算,这个时候就是浮点体现价值的时候了

使用道具 举报

帖子
1786
精华
0
积分
896
金钱
3951
荣誉
0
人气
34
评议
0
28#
发表于 2013-9-7 08:50:38 |只看该作者
浮点数是精确度貌似。。

使用道具 举报

帖子
5593
精华
0
积分
2801
金钱
11389
荣誉
0
人气
46
评议
0
27#
发表于 2013-9-7 08:34:15 |只看该作者
本帖最后由 welo010 于 2013-9-7 08:51 编辑
ksd 发表于 2013-9-6 23:07
这也不是你说嘴炮就嘴炮的。AMD被英特尔压着打正是它内核设计和软件优化的缺陷,要不也不会高频8模块还比 ...

请稍微了解一下服务器软件部分关键在哪里,不要乱放炮,你根本就是说多少错多少----说算法。稍微了解一下数学的发展行么

算法再改进用的还是数学界的那一套,再拆分还是用那一整个模型,服务器关键是资源分配和众核设备协调运作,不懂你闹什么闹,初中政治课本和历史课本都说过咱科学家在造银河时解决分层数据链被大奖特奖了一番,你上课都在睡觉吧

还平均分配,你让那些没工作休眠的CPU情何以堪------我就没见过在服务器和超算上有平均分配的机制,只知道需要多少资源就激活多少个集群CPU,不需要的休眠,人家商用超算都是这样卖资源的

使用道具 举报

帖子
378
精华
0
积分
191
金钱
3521
荣誉
0
人气
4
评议
0
26#
发表于 2013-9-6 23:07:06 |只看该作者
本帖最后由 ksd 于 2013-9-6 23:25 编辑
welo010 发表于 2013-9-6 16:07
这种是嘴炮了,算法不是说改进就能改进的,要不AMD怎么会被英特尔压着打,更何况,改进算法也不可能使浮点 ...


这也不是你说嘴炮就嘴炮的。AMD被英特尔压着打正是它内核设计和软件优化的缺陷,要不也不会高频8模块还比不过低频i7,而这正是你说的堆核,你觉得很有效么?理论性能提高了,编程用不到多线程只能白费。另外还有我说的酷睿和PD的对比。还有就拿ARM来说,你知道A9光是使用NEON就比传统的VFPv3强多少么?

而且堆核才更需要改进算法,让原来只能用到一个核的任务拆开平均分配下去。超算,服务器正是如此,数据的传输存储,任务的调度,更别说天河这种带异构的集群。买一大堆机柜有钱就行,能让它们一起跑起来的就不多了,效率能跑高的更是少。

使用道具 举报

帖子
250
精华
0
积分
137
金钱
1440
荣誉
1
人气
2
评议
0
25#
发表于 2013-9-6 21:48:28 |只看该作者
老王八 发表于 2013-9-6 11:38
不坑啊,搭配hd6000系列的好像,玩游戏比gt520还快。只是有时候有些干扰的波纹而已。
...

波紋應該是驅動需要完善。

使用道具 举报

帖子
2168
精华
0
积分
1089
金钱
6856
荣誉
0
人气
24
评议
0
24#
发表于 2013-9-6 17:13:06 |只看该作者
解压,解码啥的,都要用的

使用道具 举报

帖子
5593
精华
0
积分
2801
金钱
11389
荣誉
0
人气
46
评议
0
23#
发表于 2013-9-6 16:07:37 |只看该作者
本帖最后由 welo010 于 2013-9-6 16:10 编辑
ksd 发表于 2013-9-6 11:53
改进FPU算法,增加指令集使功能能够以更短的周期完成。改进运行机制使得数据流量更大。

酷睿2和奔腾D, ...

这种是嘴炮了,算法不是说改进就能改进的,要不AMD怎么会被英特尔压着打,更何况,改进算法也不可能使浮点性能百倍的增长,而堆核却是目前提高性能最快最有效的方式,比如服务器

使用道具 举报

帖子
378
精华
0
积分
191
金钱
3521
荣誉
0
人气
4
评议
0
22#
发表于 2013-9-6 11:53:18 |只看该作者
welo010 发表于 2013-9-6 08:26
X86你不堆核你能堆什么

改进FPU算法,增加指令集使功能能够以更短的周期完成。改进运行机制使得数据流量更大。

酷睿2和奔腾D,核数一样频率还低,浮点性能却大大增加,你觉得靠得是什么?

使用道具 举报

堕落的灰烬使者
游侠剑阁工作组【制作】
Abstego·圣殿骑士
白银圣斗士·天琴座·弦乐终曲

帖子
4313
精华
0
积分
3002
金钱
19849
荣誉
78
人气
651
评议
7

21#
发表于 2013-9-6 10:36:17 |只看该作者
niveous 发表于 2013-9-5 20:37
不过未来的趋势到确实是GPU和CPU合并...

然道你说的是APU!!那货,太坑爹了

使用道具 举报

帖子
5593
精华
0
积分
2801
金钱
11389
荣誉
0
人气
46
评议
0
20#
发表于 2013-9-6 08:26:50 |只看该作者
ksd 发表于 2013-9-5 22:45
首先你要知道ARM不止用在消费领域,更别说x86。再其次CPU增强浮点运算能力主要靠的并不是堆核。 ...

X86你不堆核你能堆什么

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

手机版|Archiver|游侠NETSHOW论坛 ( 苏ICP备2023007791号 )

GMT+8, 2025-10-10 00:51 , Processed in 0.361252 second(s), 12 queries , Gzip On, Memcache On.

Powered by Discuz! X2

© 2001-2011 Comsenz Inc.

分享到