现阶段,处理器领域除了服务器级处理器产品以及面向专业人士的处理器产品,桌面级产品也有超过30核的处理器产品。
其实在桌面消费级处理器领域,不少人认为,处理器核心数越多对游戏性能或者日常工作使用的效率越高,另外一些DIY用户看到任务管理器中多核心多线程的框框密密麻麻也有一定的优越感。
但实际上,在桌面级处理器领域,现阶段并不是核心数越多越好,这里需要考虑到用户的实际使用情况。
比如说,专业的游戏用户需要的是一个稳定高效的游戏环境,专业的视频制作人群则需要处理器有出色的多线程能力,显然多核处理器更适合这部分人群,梳理一下英特尔和AMD的产品线,英特尔酷睿X处理器与AMD的线程撕裂者正是为这部分专业人士所提供,当然,这两个系列的处理器也一定程度上有比较大的功耗需求。而针对桌面游戏玩家,英特尔的酷睿处理器和AMD的锐龙显然更加适合这部分用户。
不过,我们看到,英特尔即便是酷睿i9处理器最高才8核16线程,并且使用的是14纳米工艺。而AMD锐龙93950X则是基于7纳米,核心数达到16核32线程,乍一看AMD似乎核心多,工艺先进应该是性能表现更好,理所当然也会给有些带来更好的体验。但实际上是这样吗?这里其实很多人忽略的CPU性能的主要几个指标,一个是架构,另外一个则是频率。下面我们来聊一聊英特尔和AMD在桌面处理器上的不同。
制程之争:14纳米就赶不上7纳米吗?
其实在桌面级处理器市场,英特尔在制程问题上一直饱受诟病,不少用户都"嘲讽"英特尔"挤牙膏",这样的调侃其实也让英特尔颇为无奈。但是14纳米真的就不如7纳米吗?在晶体管密度和功耗问题上,14纳米确实和7纳米有一定的差距,但是制程问题和汽车发动机本质是一样的。
前几天笔者在开车时听收音机节目,节目主持人的一个观点非常有趣,众所周知,三菱发动机在全球有着重要的市场份额,包括很多国产汽车厂商也依旧使用三菱的发动机,虽然三菱发动机使用的技术非常"古老",但是,换句话说,越是老的技术反而也就越成熟稳定。而且经过很长时间的积淀,三菱发动机使用着非常成熟的技术,同时也很好的控制了成本。
在处理器领域,显然英特尔精心打磨14纳米工艺也是非常有必要的,因为目前英特尔14纳米工艺已经非常成熟,同时高度成熟的工艺也能很好的控制成本。英特尔采用14纳米工艺的i9-9900KS处理器已经到达英特尔14纳米桌面级处理器的顶峰,这颗英特尔处理器全核5.0GHz的睿频速度,这是连AMD7纳米制程产品都难以达到的。
14纳米相比于7纳米确实存在功耗高、晶体管密度低的问题,但是,相比于更高的性能和更稳定的运行环境,功耗只是一个小问题,晶体管密度提高带来的性能提升也是非常关键的。这也就是为什么不少玩家和用户非常关注英特尔10纳米工艺发展的原因。
早在一年多以前,英特尔10纳米工艺产品其实已经推出,其晶体管密度达到了1.008亿个/平方毫米,基本上是三星10纳米工艺的2倍,与三星7纳米工艺1.0123亿个/平方毫米基本持平。在这样的工艺加持下英特尔将处理器最小栅极间距压缩到54纳米,最小金属间距压缩到36纳米。
▲外媒TechInsights剖析的英特尔10纳米酷睿i3-8121U处理器
目前,英特尔10纳米IceLake产品已经陆续上市,首先上市的则是面向移动端的处理器产品,这批上市的10纳米移动处理器产品也凸显出更高的性能表现。现阶段英特尔推出的10纳米的十代酷睿移动处理器,其功耗更低、主频更高,这些都是工艺提升带来的优势。
▲十代酷睿移动处理器IceLake架构
当然,英特尔目前已经能将14纳米工艺产品性能打磨的与7纳米类似的水平,如果英特尔能大面积投入10纳米生产,相信桌面处理器领域还会变的更有趣。
Ring架构vsZen2架构:缓存延迟让数据处理更高效
可能很多专业的发烧友对CCD、CCX不陌生,但是AMD和英特尔两家使用了完全不同的核心架构,这就导致数据传输的速度和效率不同。以AMD三代锐龙处理器R9-3900X和英特尔酷睿i7-9700K八核架构为例。
AMD三代锐龙处理器R9-3900X采用Zen2架构,共有2个CCD,每个CCD有2个CCX核,每个CCX都是4核8线程。一般来讲数据会在内存与核心、核心与核心之间传递。我们先看核心内数据处理,如果数据在CCX核心中传递,核心与核心之间数据的访问时间是32纳秒;如果数据并不在同一个CCD核中,数据则要从一个CCD到另一个CCD,然后进入新的CCX核中继续运算,这一过程需要耗时78纳秒。
另外,处理器与DRAM内存之间的数据交互也需要时间,如果内核中没有数据,则需要从DRAM内存中读数据,AMD第三代锐龙架构从DRAM中读取数据到缓存然后到CCX核心中运算,这一过程需要75纳秒。
英特尔酷睿i7-9700K八核处理器采用了环状Ring架构,在英特尔酷睿i7-9700K的八核设计中,所有的八个核心数据间传递是采用一种环状交互方式。这种环状结构在核与核之间存在缓存延迟,数据在这8个核中,通过缓存延时可以快速传递数据,核内数据处理只需要44纳秒,而如果从DRAM内存中处理数据,这一过程则只需要72纳秒。
从理论层面出发,对于数据处理,我们看到英特尔的Ring架构相比于AMD的Zen2架构数据处理更加的高效。除了架构上的不同,英特尔处理器整体核心数并不多,以现阶段消费桌面级市场英特尔最强的i9-9900KS为例,它最高才8核16线程,而同世代的AMDR9-3950X最高已经达到了32核64线程。但是核心数对于消费级游戏玩家很重要吗?接下来我们再来看看核心数和频率的问题。
核心数与频率:游戏领域多核很鸡肋
对于游戏来讲,很重要的一点就是频率,我们对英特尔和AMD现阶段主流的两款旗舰级桌面级处理器英特尔酷睿i9-9700K和AMDR9-3900X进行对比:
处理器基频单核最大频率IntelCorei9-9700K3.6Ghz4.9GhzAMDRyzen93900X3.8Ghz4.6GHz
如果单单从单核数据来看,英特尔酷睿处理器单核最大频率更好一些,实际使用中,i7-9700K在睿频情况下,最高可以做到三到四个核心最高达到4.9GHz,而AMDR9-3900X的12个核心只有其中几个能达到4.6GHz。游戏中高频率、高稳定性是非常重要的。尽管我们看到诸如AMD很多产品都是采用了超过10核设计,但是,实际上在使用过程中,超过8核的处理器,对游戏性能提升有限。在此前英特尔科技开放日上,通过英特尔12核产品进行关闭核心的游戏测试,在《刺客信条:起源》《孤岛惊魂5》、《最终幻想15》、《极限竞速7》、《幽灵行动:荒野》、《中土世界:战争之影》、《全面战争:战锤2》、《坦克世界》等几款游戏的测试中,8核至10核游戏性能表现与10核至12核的游戏性能表现基本无异。
从4核到6核测试中,这部分游戏性能提高了35%,另外几款游戏提高15%或者更少。如果开启8核,根据英特尔官方的数据,这一状态下,游戏性能提升相比于6核状态没有太多增长,8核以上基本停滞。也就是说,有一些游戏确实有多核的需要,但大部分游戏8核就够了。
我们打个比方,日常使用过程中核心数量就像一个个撸铁的壮汉,而主频则是每个壮汉能撸多重的铁,有时候看起来好多人能举起不少东西,然而,我们日常生活中,往往很少有大家一起举东西的场景发生,常常一个人或者两个人就能解决,可能最多时候也就三四个人。我们常见大部分游戏往往只需要一两个核心出力就好。这就是为什么英特尔一直在提高处理器单核的频率却很少关注核心数量问题。
当然,英特尔对于处理器的核心频率一向很谨慎,整体偏向一个非常保守的做法,我们以刚刚推出的不久的酷睿i9-9900KS处理器为例,这款处理器睿频可以达到全核5.0GHz,使用英特尔官方的超频工具IntelPerformanceMaximizer其实可以稳定超频到5.2GHz的,但是英特尔这款超频工具一般会主动降频100MHz,降到全核5.1GHz。
当然,多核对于创意工作者来讲还是有一定的好处的。评价处理器性能不能单单只盯着核心数,制程、频率这些对于用户来讲也是非常重要的,另外,用户的使用需求决定了处理器功能向的选择。如果真的是专业级的游戏玩家,那么英特尔酷睿i9绝对是最佳选择。