PC_Shopping / PTTBBS 推薦

[閒聊] CPU 跨 Core 延遲測試

看板: PC_Shopping

作者: SkyPlus (Sky)

標題: [閒聊] CPU 跨 Core 延遲測試

時間: Mon Sep 19 11:37:42 2022


https://github.com/nviennot/core-to-core-latency


https://news.ycombinator.com/item?id=32889337



在 Hacker news 看到 CPU 跨 Core 延遲測試工具。

Github 上可以看到結果,基本上和設計上的限制一樣


Intel 12th 有趣的是 CPU 8 (P-core?) 到任一個 Core 都很快

E-Core 之間傳輸比 P-core 相對慢一點


AMD EPYC 7R13 是8個 core 一組再連接起來,

因此跨 group 的延遲從 23ns 變成 110ns


而 AWS Graviton2 是一個大 Arm 晶片,

64 Core 之間延遲都差不多


Hacker News 上有 Apple M1 Pro 的結果:

https://news.ycombinator.com/item?id=32892164



同樣可以看出是分成 4+4+2 三組

但跨 group 延遲比 AMD 高


0 59 231 205 206 206 208 219 210 210


59 0 205 215 207 207 209 209 210 210


231 205 0 40 42 43 180 222 224 213


205 215 40 0 43 43 212 222 213 213


206 207 42 43 0 44 182 227 217 217


206 207 43 43 44 0 215 215 217 217


208 209 180 212 182 215 0 40 43 45


219 209 222 222 227 215 40 0 43 43


210 210 224 213 217 217 43 43 0 44


210 210 213 213 217 217 45 43 44 0


--


--

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.113.235.116 (臺灣) ※ 文章網址 ※ ※ 編輯: SkyPlus (140.113.235.116 臺灣), 09/19/2022 11:45:19
ltytw : 好的


英特爾又贏了一次 09/19 12:14
tingstart : 記憶體控制器也會有延遲 09/19 12:14
fmp1234 : 細膩 09/19 12:21
wonder007 : 膠水延遲 09/19 12:33
jeff40108 : intel延遲贏這在zen剛出的時候就知道了 09/19 12:46
jeff40108 : 後來蘇媽有改一版infinity fabric但還是輸一點 09/19 12:47
jeff40108 : 但intel付出的代價也不小,server晶片的die size跟 09/19 12:48
jeff40108 : 價格都壓不下 09/19 12:48
jeff40108 : 09/19 12:48
Transposon : 良率跟成本還是蘇媽贏啊 09/19 12:56
iq1000x : 使用者不太需要去考慮這麼細的事情吧 09/19 12:57
iq1000x : 最後整體跑出來多快才是使用者要的 09/19 12:57
friedpig : 牙膏13還是14gen P跟E溝通也有改進 09/19 12:58
mrme945 : https://i.imgur.com/rJmL8hz.png https://i.imgur.com/rJmL8hz.png


Zen3八核內看起來延遲 09/19 12:59
mrme945 : 不錯,但超過就暴增了 09/19 12:59
friedpig : 就有沒有跨CCX的差別阿


只是單純的MCM要多快也難拉 09/19 13:01
leung3740250 : 牙膏big.LITTLE還有很大的優化空間,big.LITTLE會 09/19 13:06
leung3740250 : 拖累大核的latency,但不至於會高14ns 09/19 13:06
friedpig : 13Gen好像有正常了 但是E core內部的交換反而慢 09/19 13:12
friedpig : https://bit.ly/3ScstRz



小核叢集內慢是本來就有 13Gen 09/19 13:14
friedpig : 沒改善 但大到小看起來沒啥問題了 09/19 13:14
saimeitetsu : 小笨賢:貼核,卡卡,numa 09/19 13:28
leung3740250 : 因為小核內沒snoop filter 09/19 13:40
leung3740250 : 因為10ff GMT妥協了不少東西 09/19 13:42
friedpig : 可憐那 09/19 13:58
sdbb : 優文 09/19 15:33
E6300 : 牙膏那個能算是big little嗎? 09/19 17:21
aegis43210 : 算呀,都特地設計了一個MCU來分配執行緒了 09/19 17:52
kuma660224 : 英特爾的小核是中核 09/19 18:10
SHR4587 : 那叫Big Midium好了,簡稱BM 09/19 18:35
Beyondlife : 從延遲看起來還是主要侷限在物理結構層面,如果amd 09/20 09:30
Beyondlife : 跨ccx延遲能壓到跟intel 12代水準,或是intel 的整體 09/20 09:30
Beyondlife : 延遲能跟amd 單ccx延遲一樣那才是有趣 09/20 09:30
friedpig : AMD要壓也不難 2.5D下去就好了 牙膏14 Gen就不鳥成本直 09/20 09:37
friedpig : 接2.5D AMD大概還要等GG封裝有CP值才會大量用2.5D吧 09/20 09:38