图拉丁吧 关注:8,148,435贴子:134,278,840
  • 9回复贴,共1

我是研究处理器架构的博士生,关于处理器架构,你有什么想问的?

取消只看楼主收藏回复

我是研究处理器架构的博士生,我的知乎ID是shinezyy,关注图吧潜水多年
我大一下学期开始上图吧,捣鼓各种硬件。一定程度上,受这个兴趣影响,大三保研选研究方向的时候,我选了计算机体系结构这个方向。通俗地说,计算机体系结构就是研究CPU、GPU、内存、加速器等硬件怎么算得更快、怎么和上面的应用配合的计算机子方向。更具体一点,我的子方向是处理器架构设计。我目前有一篇共同第一作者的研究SMT(超线程)的文章,还有一篇研究单核架构的文章在投(还没录用)。有一说一,这个论文发表情况放在世界范围内来看并不优秀,只能算凑合吧,可能因为我太懒……
我之前尝试在知乎科普计算机体系结构的研究,但是我所有关于研究架构的专业回答、文章都没啥关注度(毕竟这个方向不算热门吧),反而是抖机灵、撕B、蹭热点的回答热度很高。有时候我就想,或许像图吧、卡吧这样的小领域的贴吧更适合我做科普吧。
各位对计算机、硬件架构,尤其是处理器架构有什么问题和看法的可以在下面提问和交流。毕竟大家只是爱好者,我不准备聊太多和研究相关的东西,只准备用一些课本、论文里面学到的知识和实际问题结合。


IP属地:北京1楼2020-05-10 13:32回复
    一个能直观地感受到发烧友和我们做研究的不同是:我们评估单核用SPECCPU2006/2017、geekbench,评估多核用Parsec。而硬件爱好者用superPI、鲁大师、cinebench。
    我个人的建议是,别看跑分,你跑什么应用、玩什么游戏就看应用速度、游戏帧率。
    像superPI、cinebench都是刻画特点类型的应用的性能,而你的应用、游戏的特征可能和它们并不一样。


    IP属地:北京4楼2020-05-10 13:39
    收起回复
      2026-05-29 05:19:38
      广告
      不感兴趣
      开通SVIP免广告
      @瞿蛆
      那就讲讲3100x/3300x的结构优缺点吧
      --------------------------------------------------------------------------------------------
      先声明一下,其实我不做多核和互联,所以我在这方面的知识只能到普通水平。
      为了理解3100和3300x的区别,首先可以介绍下infinity fabric和chiplet技术。这两种都属于大家常说的“胶水”技术。


      IP属地:北京6楼2020-05-10 13:50
      收起回复
        其实关于3300x和3100,主要可以参考这个测评:
        anandtech.co和谐m/show/15774/the-amd-ryzen-3-3300x-and-3100-cpu-review
        关于infinity fabric和chiplet可以参考这个:
        reddit.co和谐m/r/Amd/comments/bwb91q/highlevel_overview_of_essential_terminology_what/


        IP属地:北京7楼2020-05-10 13:55
        收起回复
          我第一眼看见3100核的分布的时候,我第一感觉是3100的频率可以比3300x跑得更高。因为一个CCX放2个核的时候,供电散热压力都变小了。但是我一看,居然3300x的频率更高,还是很意外的。不过现在也有超频的结果出来了,说3100超频很猛。后面再看看吧,超频能力这件事,要有足够样本才有意义。


          IP属地:北京8楼2020-05-10 14:10
          收起回复
            关于单CCX的性能是不是总是比双CCX更好?
            从核间通信延迟来看,确实单CCX更好,但是孰优孰劣还是要看应用特点。有的多核应用的线程间通信少,有的多。如果通信多,那么单CCX优势显著。如果通信少或者无通信,那么单CCX和双CCX区别也不大。
            我举个例子,


            什么样的多核应用进程间通信多呢?我举个例子,下图红框里面框出来的4个并行应用,比如x264视频编码,再比如Ferret搜索相似图片。这些进程间通信多的应用就要选单CCX的。

            什么样的应用选多CCX呢?比如上图里面的raytrace、swaptions。raytrace,如果我没有理解错,拿就是大家熟知的RTX2060上面的“光追”,是的,CPU也可以跑光追算法。
            另外,还有一种工作场景:我希望一边浏览网页一边干活儿,这种场景下浏览器和生产软件之间肯定没交互,所以用多CCX的也不会遭受性能损失。


            IP属地:北京12楼2020-05-10 14:28
            收起回复
              不过知乎上有个人推测单CCX对内存控制器更友好,这点我没考证。如果是真的,那么三缓缺失率高、访存密集的应用也更适合单CCX。


              IP属地:北京16楼2020-05-10 14:34
              收起回复
                对Alderlake的大小核设计你怎么看?
                ----------------------------------------------------
                我觉得挺好的,我在之前的研究工作中观察到很多应用无法从大窗口的乱序执行中显著收益,这种应用如果不是性能关键的应用,用顺序小核或者小窗口低发射的乱序核去执行会有更好的性能功耗比。
                根据论文和业内人士的统计,可以认为ARM的大核性能是小核的1.5~2倍,功耗是6倍。对于在大核上收益很小的应用,放在小核上是最划算不过的。
                我之前和导师还有某公司的人聊过这个方向,考虑过做这个方向的研究。但是,最后觉得这个方向已经有人做过两,不够exciting,就没做。


                IP属地:北京18楼2020-05-10 14:41
                收起回复
                  2026-05-29 05:13:38
                  广告
                  不感兴趣
                  开通SVIP免广告
                  英特尔Sunny Cove(Ice Lake)和后续的Willow Cove(Tigerlake和Rocket Lake),比起旧的Skylake会有哪些缺点或不足的地方呢?
                  ----------------------------------------------------------------------------------------
                  指令窗口很大,增加了同频性能,但是性能功耗比会下降。我瞎猜或许是Intel要寻求大小核的原因之一?
                  我自己的研究就和指令窗口、多发射有关系,这个方向属于是很费劲,但是边际效应递减的一个方向。我很佩服Intel能做sunny cove这样的怪兽出来,但是商业上是否能成功我不好说。


                  IP属地:北京23楼2020-05-10 14:51
                  收起回复
                    很多人问到国产处理器的发展,可以看看这个帖子:
                    http://www.bilibili.co和谐m/read/cv4524682
                    关键指标就看SPEC int rate 2006的单核高频测试成绩和多核高频测试成绩。
                    现在国内公开的最厉害的就是某为的 hi1630了,我去年在逼乎写过一个答案,当时hi1620是最厉害的:http://www.zhihu.co富强m/question/319945886/answer/649942007
                    虽然某为996,但是这方面还是没得黑的。
                    菊花手机上目前用的是ARM公版核(或者公版小改);但是他们的服务器处理器(hi16x0)是自己设计的核。如果美国哪天断供了,hi1630的性能肯定够用了。虽然和9900k这些差距还很大,但是肯定能用,不至于被摁死。
                    如果有朋友只是盼望着我们有自己的处理器,那么龙芯、华为等公司都已经实现了。
                    不必要纠结指令集的问题,以华为的实力,肯定有能力切换到ARM以外的指令集,只是没必要。对我们做架构设计的而言,指令集重要,但是不是最卡脖子的问题。


                    IP属地:北京341楼2020-05-14 22:01
                    收起回复