https://github.com/nviennot/core-to-core-latency
https://news.ycombinator.com/item?id=32889337
在 Hacker news 看到 CPU 跨 Core 延遲測試工具。
Github 上可以看到結果,基本上和設計上的限制一樣
Intel 12th 有趣的是 CPU 8 (P-core?) 到任一個 Core 都很快
E-Core 之間傳輸比 P-core 相對慢一點
AMD EPYC 7R13 是8個 core 一組再連接起來,
因此跨 group 的延遲從 23ns 變成 110ns
而 AWS Graviton2 是一個大 Arm 晶片,
64 Core 之間延遲都差不多
Hacker News 上有 Apple M1 Pro 的結果:
https://news.ycombinator.com/item?id=32892164
同樣可以看出是分成 4+4+2 三組
但跨 group 延遲比 AMD 高
0 59 231 205 206 206 208 219 210 210
59 0 205 215 207 207 209 209 210 210
231 205 0 40 42 43 180 222 224 213
205 215 40 0 43 43 212 222 213 213
206 207 42 43 0 44 182 227 217 217
206 207 43 43 44 0 215 215 217 217
208 209 180 212 182 215 0 40 43 45
219 209 222 222 227 215 40 0 43 43
210 210 224 213 217 217 43 43 0 44
210 210 213 213 217 217 45 43 44 0
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.113.235.116 (臺灣)
※ 文章網址 ※
※ 編輯: SkyPlus (140.113.235.116 臺灣), 09/19/2022 11:45:19
推
ltytw :
好的
英特爾又贏了一次
09/19 12:14
推
tingstart :
記憶體控制器也會有延遲
09/19 12:14
推
fmp1234 :
細膩
09/19 12:21
→
wonder007 :
膠水延遲
09/19 12:33
推
jeff40108 :
intel延遲贏這在zen剛出的時候就知道了
09/19 12:46
→
jeff40108 :
後來蘇媽有改一版infinity
fabric但還是輸一點
09/19 12:47
→
jeff40108 :
但intel付出的代價也不小,server晶片的die
size跟
09/19 12:48
→
jeff40108 :
價格都壓不下
09/19 12:48
→
jeff40108 :
來
09/19 12:48
推
Transposon :
良率跟成本還是蘇媽贏啊
09/19 12:56
推
iq1000x :
使用者不太需要去考慮這麼細的事情吧
09/19 12:57
→
iq1000x :
最後整體跑出來多快才是使用者要的
09/19 12:57
→
friedpig :
牙膏13還是14gen
P跟E溝通也有改進
09/19 12:58
→
mrme945 :
不錯,但超過就暴增了
09/19 12:59
→
friedpig :
就有沒有跨CCX的差別阿
只是單純的MCM要多快也難拉
09/19 13:01
→
leung3740250 :
牙膏big.LITTLE還有很大的優化空間,big.LITTLE會
09/19 13:06
→
leung3740250 :
拖累大核的latency,但不至於會高14ns
09/19 13:06
→
friedpig :
13Gen好像有正常了
但是E
core內部的交換反而慢
09/19 13:12
→
friedpig :
沒改善
但大到小看起來沒啥問題了
09/19 13:14
推
saimeitetsu :
小笨賢:貼核,卡卡,numa
09/19 13:28
→
leung3740250 :
因為小核內沒snoop
filter
09/19 13:40
→
leung3740250 :
因為10ff
GMT妥協了不少東西
09/19 13:42
→
friedpig :
可憐那
09/19 13:58
推
sdbb :
優文
09/19 15:33
推
E6300 :
牙膏那個能算是big
little嗎?
09/19 17:21
推
aegis43210 :
算呀,都特地設計了一個MCU來分配執行緒了
09/19 17:52
→
kuma660224 :
英特爾的小核是中核
09/19 18:10
推
SHR4587 :
那叫Big
Midium好了,簡稱BM
09/19 18:35
推
Beyondlife :
從延遲看起來還是主要侷限在物理結構層面,如果amd
09/20 09:30
→
Beyondlife :
跨ccx延遲能壓到跟intel
12代水準,或是intel
的整體
09/20 09:30
→
Beyondlife :
延遲能跟amd
單ccx延遲一樣那才是有趣
09/20 09:30
→
friedpig :
AMD要壓也不難
2.5D下去就好了
牙膏14
Gen就不鳥成本直
09/20 09:37
→
friedpig :
接2.5D
AMD大概還要等GG封裝有CP值才會大量用2.5D吧
09/20 09:38