應用

技術

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點新聞
企業(yè)注冊個人注冊登錄

深度測試AMD 3D V-Cache技術,過譽了?

2022-01-26 10:27 半導體行業(yè)觀察
關鍵詞:AMD3DV-Cache芯片

導讀:3D V-Cache 是 AMD 開發(fā)的一項新技術,可以讓 L3 緩存垂直堆疊,這樣可以在占用很少空間的情況下顯著增加緩存的大小。

  近日,科技評論網(wǎng)站Chips and Cheese發(fā)布了 AMD 新3D V-Cache技術的評論,展示了其與前幾代 Zen 處理器相比的性能。Chips and Cheese 選擇了 AMD 的 EPYC(霄龍)服務器處理器來擔任這個角色,包括支持 3D V-Cache 的 EPYC 7V73(Milan-X)和 vanilla Zen 3 EPYC 7763(Milan)。

  3D V-Cache 是 AMD 開發(fā)的一項新技術,可以讓 L3 緩存垂直堆疊,這樣可以在占用很少空間的情況下顯著增加緩存的大小。AMD 已經(jīng)通過新技術展示了令人印象深刻的性能提升,因為它允許 CPU 內(nèi)核始終如一地獲得更多信息。

  單獨比較 Zen 3,有無 3D V-Cache 時,Chips and Cheese 注意到,當測試沒有使用更多的 L3 緩存時,帶有 3D V-Cache 的EPYC 7V73的性能僅比普通 Zen 3 EPYC 7763 差一點。7763 必須提供什么。延遲差異為三到四個周期,由于 3D V-Cache,這是一個必要的權衡。

  然而,一旦 7763 上的緩存被填滿,7V73 憑借其巨大的緩存大小,使得芯片的延遲比 7763 顯著減少,直到 3D V-Cache 被填滿。有趣的是,7V73 的內(nèi)存延遲也比 7763 略低。

image.png

  在將 Zen 1 和 Zen 2 EPYC 芯片(如 7551 和 7452)添加到組合中時,我們看到了 AMD 3D V-Cache 芯片真正經(jīng)過精心設計的更好畫面。Chips and Cheese 指出,L3 緩存設置為從 Zen 1 計數(shù)到 Zen 2 會產(chǎn)生大約 5 個周期的額外延遲。然后從 Zen 2 統(tǒng)一 Zen 3 上的雙 16MB L3 緩存塊的舉措增加了更高的 7 到 8 個延遲周期。

  與此同時,AMD 從 Zen 3 遷移到 Zen 3 3D V-Cache,并將 L3 緩存大小增加三倍只需要三到四個周期的延遲,這是迄今為止我們看到的最微不足道的損失。

  Chips and Cheese 的圖表顯示,所有 Zen 世代的 L1 和 L2 緩存延遲幾乎相同。盡管如此,當談到 L3 緩存時,延遲會隨著代際之間的 L3 緩存使用量的增加而減少,尤其是在 Zen 3 到帶有 3D V-Cache 的 Zen 3 中。

  帶寬

  在帶寬結果中,Chips and Cheese 發(fā)現(xiàn) AMD 的 7V73X 3D V-Cache 提供的帶寬不如 AMD 所宣傳的那么多。在測試中,它注意到 7V73X 在單線程緩存帶寬測試中每個周期只增加了大約 25% 的字節(jié)——這與 AMD 承諾的 2 倍帶寬增益相去甚遠。

image.png

  然而,Chips 和 Cheese 認為,一旦 CPU 處理利用 L3 緩存的更大工作負載,時鐘速度可能會降低,這確實解釋了這種差異。

  另一個奇怪的現(xiàn)象出現(xiàn)在7V73X上,單顆CCD緩存帶寬測試顯示,3D V-Cache芯片的帶寬相比標準7763略有不足,約為12.5%。Chips and Cheese 懷疑這是為了控制功率,因為兩個芯片上都加載了 64 個內(nèi)核。這很有意義,因為 3D V-Cache 確實占用了更多空間并且需要更多的功率,這使得 CPU 冷卻變得更加復雜。

  有趣的是,同樣的現(xiàn)象也發(fā)生在 AMD 基于 Zen 2 微架構的 EPYC 7452 芯片上。EPYC(霄龍)7763 Zen 3 CPU 是唯一一款在單 CCD 帶寬測試和單線程帶寬測試中表現(xiàn)均等的芯片。

  對于那些想知道 Zen 1 的人來說,緩存帶寬甚至比 Zen 2 和 Zen 3 還差。在絕大多數(shù)測試中,經(jīng)過測試的 EPYC 7551 的帶寬不到一半。直到測試的中期和結束階段,它才接近趕上。

  結論

  那么所有這些數(shù)據(jù)在現(xiàn)實世界的表現(xiàn)方面意味著什么呢?Chips and Cheese 運行了多個基準測試,包括 Gem5、libx264 4K 轉(zhuǎn)碼、7-Zip 等。只有在 Gem5 中,3D V-Cache 才對性能產(chǎn)生了顯著影響。其余的則乏善可陳,幾乎不引人注意,大約 5% 的性能優(yōu)勢有利于 3D V-Cache 芯片。

  Chips and Cheese 的初步結果表明,3D V-Cache 的影響并不像 AMD 已經(jīng)預測的那樣顯著。但是,它需要更深入的測試才能通過判斷。此外,我們不能忘記這是 AMD EYPC 服務器處理器上的 3D V-Cache,因此 3D V-Cache 在其消費者對應產(chǎn)品上的行為可能會有所不同。

  一方面,7V73X 是一個擁有 64 個核心的怪物芯片,因此該芯片對熱量和功率輸出很敏感,如果需要,它會迅速限制 CPU 核心。它是通過添加緩存來調(diào)整的,對 CPU 增加了更多的功率和散熱要求。

  另一個是服務器工作負載,由于其性質(zhì),傳統(tǒng)上它的計算量比延遲敏感度更高。3D V-Cache 只有在內(nèi)核不是瓶頸并且不運行需要大量時間來處理的線程時才會被證明是有用的。

  在消費領域,我們看到芯片的內(nèi)核數(shù)量大大減少,這降低了功率要求,并允許內(nèi)核在時鐘速度偏差較小的情況下伸展它們的腿。強大的冷卻系統(tǒng)和主板包含強大的供電解決方案,其空間遠大于 CPU 在 PC DIY 空間中所需的空間,這不是問題。

  消費場景中的應用的計算密集度通常要低得多,這使得緩存延遲發(fā)揮了更關鍵的作用。這在視頻游戲中是非常正確的,其中 CPU 很少加載到 100%,但是具有較低的延遲意味著預渲染幀可以更快地傳輸?shù)?GPU,減少輸入延遲并提高幀速率。

  參考鏈接:

  https://www.tomshardware.com/news/amd-3d-v-cache-benchmarks-mixed-results-milan-x-cpus

  https://chipsandcheese.com/2022/01/21/deep-diving-zen-3-v-cache/