[討論] AGI 評鑑/預測
看板: Soft_Job
作者: AmosYang (twy30)
標題: [討論] AGI 評鑑/預測
時間: Fri Jul 4 11:56:47 2025
對 AGI (Artificial General Intelligence) 的進展有興趣的話可以看看
這個
AGI
評鑑系統,尤其是試玩一下它的
2025
年版的
ARG-AGI-2
題目
(
https://arcprize.org/play),
* 看看你覺得這樣的題目對人腦來說的難易度
* 看看你覺得「符號解讀、組合推理、上下文規則應用」是否為 AGI 的必要條件
* 看看你覺得這些題組是否能有效測量「符號解讀、組合推理、上下文規則應用」
然後參考以下數據
(
https://arcprize.org/leaderboard):
* 人腦最高分是 100%, 每個工作項目成本 $17
* 最高分的 AI (Claude Opus 4) 得分 8.6%, 每個工作項目成本 $1.93
* 次高分的 AI (ChatGPT o3) 得分 6.5%, 每個工作項目成本 $0.834
* 「純 LLM」 AI 最高分數 1.3%
2019~2024 年使用的 ARC-AGI-1 題目, AI 最高得分是約 75% 。
另一個可以參考的網站是
https://theagiclock.com/,預測
AGI
到來的時間
(以及解釋它預測的根據); 可以 3~6 個月後來看看 AGI 的進展是線性、指數
,還是卡關。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 136.47.253.135 (美國) ※ 文章網址 ※的預測是 2028-06-30 。
※ 編輯: AmosYang (136.47.253.135 美國), 07/04/2025 12:00:02 ※ 編輯: AmosYang (136.47.253.135 美國), 07/04/2025 12:07:37 ※ 編輯: AmosYang (136.47.253.135 美國), 07/04/2025 12:10:57
推
jamesho8743 :
有意思的網站
謝分享
07/04 12:24
推
attacksoil :
有趣
07/04 12:36
===
推
haudoing :
還蠻好玩的我還沒輸XD
07/07 16:43
推
KAOKAOKAO :
本以為是抬槓文
有更進一步列出各專家的預測及觀點;從
Elon
Musk
的
2025~2026
到
推
CoNsTaR :
最近有一篇論文用一個
27M
(對,27M
不是
27b)
paramete
08/02 14:34
Andrew
Ng
的
2040~2060
都很有意思。
→
CoNsTaR :
rs
的
recurrent
network
沒有
pre-training,訓練只用了
08/02 14:34
※ 編輯: AmosYang (136.47.253.135 美國), 07/04/2025 12:42:54
→
CoNsTaR :
1000
steps
就達到
40%
08/02 14:34
*
原標題:
[討論]
AGI
*
新標題:
[討論]
AGI
評鑑/預測
有其它擴充方向可以提出來討論。
※ 編輯: AmosYang (136.47.253.135 美國), 07/11/2025 04:45:21
※ 編輯: AmosYang (136.47.253.135 美國), 07/11/2025 04:47:47
Grok
4
拿下最高分
16%,
每工作項目成本
$2.17
※ 編輯: AmosYang (136.47.253.135 美國), 07/11/2025 04:49:26