L1指令缓存依然是32KB 8-Way,但对预取和利用率都进行了改良优化,操作缓存则进行了简化,效率会比Zen 2更高 。
执行引擎执行引擎在整数与浮点方面都进行了改进
文章插图
整数单元方面,Zen 3的整数调度器从Zen 2架构的92个条目增加到96个条目,现在有四个24条目的ALU/AGU调度器 。物理寄存器文件从180增长到192,从而提供了更大的操作窗口 。重排序缓存从224条目增加到256条目 。每个内核依然拥有四个整数ALU单元和三个AGU地址生成单元,增加了一个专用分支单元和两个st数据选择器,现在每周期可并行处理10个事件 。
文章插图
Zen 3内核与Zen 2内核的ALU执行单元是相同的,但Zen 3的调度器允许不同工作负载之间均衡共享使用ALU和AGU,这种共享调度制度可提供更大的吞吐量 。
文章插图
浮点执行单元从4个增加到6个,增加了独立的F2I/存储单元,用于存储和把浮点寄存器文件搬到整数单元,现在MUL和ADD不用在兼顾这些操作了,能够专注自己的工作了,每周期的运算能力更强了,FMAC周期从5缩短到4,使用了更强的调度器,减少了选择浮点和整数操作的延迟 。
读取与存储系统
文章插图
Zen 3内核的存储队列从48个增加到64个,L2 DTLB的数量依然是2K,L1数据缓存依然是32KB 8-Way,但与Zen 2架构的相比,每时钟周期的读取和存储次数都加了一,现在每时钟周期能进行三次读取操作和两次存储操作,但如果是浮点数据的话每周期操作数会减一,读取/存储操作更具灵活性。
Zen 3架构的CCX进行了改动,现在每个CCX的L3缓存翻了一倍,所以预取算法进行了改动,能更高效的利用更大的L3缓存 。使用了新技术缩短了存储-读取这样的转发操作的延迟 。整个读取与存储系统有更高的带宽 ,可以满足更大更快的执行资源的需求 。
8核心CCX
文章插图
与内核的改动相比,CCX的改动才是最大的,Zen与Zen 2架构每个CCD内都有2个CCX,而每个CCX内包含4个核心,并且有各自独立的8MB或16MB L3缓存,到了Zen 3架构AMD修改了CCX的设计,每个CCX内有8个核心,L3缓存现在也是全部核心共享的32MB,这样能够有效降低CPU核心之间的通信延迟 。Zen 2架构即使同一芯片内的CCX之间通信也是要走IOD上的SDF的,延迟非常大,Zen 3架构这一的改动大幅降低了同一芯片内核心通信的延迟,并且能够有效降低内存延迟,随着缓存与内存效能的提升,Zen 3架构能获得更好的游戏性能 。
此外由于单个CCX的核心数量从4个增加到8个,CCX的内部总线也一同变了,AMD放弃了一直沿用的XBAR总线,改用了环形总线,毕竟4核互联只需要6条XBAR就足够了,但8核的话需要28条,复杂度大幅增加,改用环形总线确实是更好的选择 。
不变的MCM封装与IOD
文章插图
文章插图
Zen 3的CCD依然是使用台积电7nm工艺生产的,芯片面积是80.7mm2,晶体管数量是41.5亿,而Zen 2的CCD面积是74mm2,内部有39亿个晶体管 。IOD依然是那个没换,用GF的12nm工艺,芯片面积125mm2,内部有20.9亿个晶体管 。
封装方面这个其实和Zen 2是一样的,一个CPU内包含一或两个CCD合一个IOD,相互之间采用Infinity Fabric总线连接,上行带宽32B每周期,下行带宽16B每周期,所以同样会出现Zen 2那样的单CCD处理器内存写入速度只有双CCD的一半的这种情况 。
由于IOD没换,所以内存控制器也是那样有内存频率和IF总线存在1:1或1:2分频的现象,但锐龙5000系列的fclk能跑到2000MHz,所以内存能够跑到DDR4-4000并采用1:1分频,但目前BIOS还有些问题,只有体质好的处理器能跑到2000MHz的fclk,等以后更新到AGESA 1.1.8.0之后就大部分都能达到了 。
目前Intel/AMD在售主流处理器目前Intel在售处理器的主流是第十代酷睿处理器,基本上从酷睿i3到酷睿i9的出货都已经是第九代酷睿的天下,上两代产品虽然还能买到,但由于接口不相容所以除了升级已经没有购买的必要 。而AMD这边虽然说有最新的锐龙5000处理器 ,但仅有4款产品,产品线覆盖不完全,所以锐龙3000依然占据了大部分市场 。
秒懂生活扩展阅读
- 中国品牌电冰箱排名 中国电冰箱质量排名
- 中国科技大学在国内排名第几
- 全国十大美术学院排名 九大美院排名
- 世界排名第一辣的泡面
- 高通骁龙排行榜2022 高通骁龙排行榜
- 防身武器排名 防身武器大全
- nba助攻榜历史排名 nba篮板榜历史排名
- 苹果的处理器可以放到安卓上吗
- 硬盘小游戏排名 硬盘小游戏
- 上海浦东初中学校排名 上海中学地址