Soft_Job / PTTBBS 推薦

[討論] AGI 評鑑/預測

看板: Soft_Job

作者: AmosYang (twy30)

標題: [討論] AGI 評鑑/預測

時間: Fri Jul 4 11:56:47 2025


對 AGI (Artificial General Intelligence) 的進展有興趣的話可以看看


https://arcprize.org/

這個

AGI

評鑑系統,尤其是試玩一下它的

2025

年版的


ARG-AGI-2

題目

(

https://arcprize.org/play

),


* 看看你覺得這樣的題目對人腦來說的難易度

* 看看你覺得「符號解讀、組合推理、上下文規則應用」是否為 AGI 的必要條件

* 看看你覺得這些題組是否能有效測量「符號解讀、組合推理、上下文規則應用」


然後參考以下數據

(

https://arcprize.org/leaderboard

):


* 人腦最高分是 100%, 每個工作項目成本 $17

* 最高分的 AI (Claude Opus 4) 得分 8.6%, 每個工作項目成本 $1.93

* 次高分的 AI (ChatGPT o3) 得分 6.5%, 每個工作項目成本 $0.834

* 「純 LLM」 AI 最高分數 1.3%


2019~2024 年使用的 ARC-AGI-1 題目, AI 最高得分是約 75% 。


另一個可以參考的網站是

https://theagiclock.com/

,預測

AGI

到來的時間

(以及解釋它預測的根據); 可以 3~6 個月後來看看 AGI 的進展是線性、指數

,還是卡關。


--

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 136.47.253.135 (美國) ※ 文章網址 ※


https://theagiclock.com/

的預測是 2028-06-30 。

※ 編輯: AmosYang (136.47.253.135 美國), 07/04/2025 12:00:02 ※ 編輯: AmosYang (136.47.253.135 美國), 07/04/2025 12:07:37 ※ 編輯: AmosYang (136.47.253.135 美國), 07/04/2025 12:10:57
jamesho8743 : 有意思的網站 謝分享 07/04 12:24
attacksoil : 有趣 07/04 12:36
===
haudoing : 還蠻好玩的我還沒輸XD 07/07 16:43
KAOKAOKAO : 本以為是抬槓文


內容是有料資訊


建議標題擴充 07/09 08:54
有更進一步列出各專家的預測及觀點;從 Elon Musk 2025~2026
CoNsTaR : 最近有一篇論文用一個 27M (對,27M 不是 27b) paramete 08/02 14:34
Andrew Ng 2040~2060 都很有意思。
CoNsTaR : rs recurrent network 沒有 pre-training,訓練只用了 08/02 14:34
※ 編輯: AmosYang (136.47.253.135 美國), 07/04/2025 12:42:54
CoNsTaR : 1000 steps 就達到 40% 08/02 14:34
* 原標題: [討論] AGI
* 新標題: [討論] AGI 評鑑/預測
有其它擴充方向可以提出來討論。
※ 編輯: AmosYang (136.47.253.135 美國), 07/11/2025 04:45:21
※ 編輯: AmosYang (136.47.253.135 美國), 07/11/2025 04:47:47
Grok 4 拿下最高分 16%, 每工作項目成本 $2.17
※ 編輯: AmosYang (136.47.253.135 美國), 07/11/2025 04:49:26