最近Andrej Karpathy 貼了一個meme
https://x.com/karpathy/status/1976082963382272334
雖然他說,他只是要誇大強調太多exceptions
https://chatgpt.com/share/68e82db9-7a28-8007-9a99-bc6f0010d101
上面是對話。
Karpthy是ai大神,"vibe coding"這詞也是他發明的,但寫程式不是他的強項。
這短短的幾行程式裡,有多餘的程式碼,有無效的程式碼,有dead codes。太多的exceptions只是其中一個問題
我把簡化的prompt丟到gemini,好一點,但一樣大有問題。
這其實就是我的ai coding經驗。ai slop,浪費時間。真的junior起碼不敢亂寫。ai就是倒垃圾碼出來讓你一直糾正。
之前我在本版說ai coding寫的程式有微妙的問題。但這麼久了,現在的評語就是垃圾,"ai slop"不是講假的。
※ 引述《yamakazi (大安吳彥祖)》之銘言:
: 抱歉,但你這做法有改進空間
: 如果是做演算法,優先用python 寫
: 現在主流AI寫python幾乎不可能錯
: 寫完後叫AI自己生一些測資再畫圖給你看
: 圖看完沒問題後再叫他改寫成C++
: 要特別跟他說不要亂猜
: 不懂的api和算法去看完python原始碼再來改寫
: 如果有看完原始碼再改寫的
: 我體感上幾乎不可能出錯
: 99趴沒問題
你被ai網軍洗腦太成功了,真的做了,就知道完全不是這麼回事。
Python改寫c++?你是認真的?本來只有一個問題,現在你有兩個大問題。
Cython搞那麼久,為什麼還是那麼少人用?
typeless, gc, reference/ptr。光是這些差異就難搞死了。
: 剩下一趴你跟他對話也能改到好
: 再用剛剛的測資對一下bit true
: 輕鬆解決
: 要進去看扣嗎?
: 幾乎不用
這真是最大笑話。
現在的ai best practices就是請你一定要看程式碼。因為錯了不是ai的問題是你的問題。
還是要強調,ai不是沒有用,但現在genAi走的方向是錯的。這些ai公司要賺錢,強推各種solutions。
workslop,ai slop最近流行起來不是沒有原因的。
最後講個故事。有人在網路抱怨,說他外包程式很久了,他不期待2x或10x的ai產值,但他現在變成ai prompter,他要花很多時間去解釋為什麼回來的程式碼有問題。現在他是0.1x的發包商。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 58.114.66.74 (臺灣)
※ 文章網址 ※
推
yamakazi :
Www
10/14 08:21
推
henrylin8086 :
我再上篇文提到要一直問不如自己寫就是這原因
10/14 09:52
→
henrylin8086 :
我Py跟C++都寫,這兩個程式語言思路差異很大
10/14 09:53
→
henrylin8086 :
用AI根據上文給建議還不錯,但用問的我覺得比自己寫
10/14 09:55
→
henrylin8086 :
還累,因為要一直修正。
10/14 09:55
→
henrylin8086 :
但也可能是因為我用copilot,沒近期其他模型先進
10/14 09:58
→
MoonCode :
想太多了
一年兩年後這些問題不存在
10/14 10:21
推
NDark :
推樓上,是變化太快,任何認知都很快過時
10/14 10:39
→
NDark :
就我個人不擅長的領域是蠻好用的,但永遠也不會到達專精
10/14 10:40
→
NDark :
的程度
10/14 10:40
→
NDark :
如果我的問題是專精才能理解的地步,那我也看不出來有錯
10/14 10:40
推
Nitricacid :
推
‘錯了不是AI的問題是你的問題’
光這點就不可能
10/14 10:44
→
Nitricacid :
被AI取代了
10/14 10:44
→
yamakazi :
你沒仔細看,這是他下的prompt,故意用極端的prompt來測
10/14 12:03
→
yamakazi :
試才會這樣,而且其實還是能用只是太多防禦性代碼而已
10/14 12:03
→
yamakazi :
我就問你各位誰會下「extraordinarily
cautious,
you
ne
10/14 12:05
→
yamakazi :
ver
knows
what
could
go
wrong」
10/14 12:05
推
yamakazi :
你去叫一個本科新人寫一樣的東西,跟他說特別小心corner
10/14 12:06
→
yamakazi :
case,他大概也會寫出類似東西,因為AI跟人類學的
10/14 12:06
你真的是外行人。我已經說那個程式碼有無效的,有多餘的,有dead
codes,甚至完全錯誤的部份。
→
yamakazi :
還有python
底層就是C++,你覺得python寫的東西不可能轉
10/14 12:07
我也說我有簡化prompt去gemini測試。
→
yamakazi :
成C++?
10/14 12:07
推
richardz :
樓上python
底層是C
...
10/14 12:10
推
ILoveAMD :
compiler
跟
transpiler
是不同概念
compiler是某個語
10/14 12:17
→
ILoveAMD :
言實作的
不代表能無痛轉成那個實作語言
10/14 12:17
推
yamakazi :
我同意不可能百分百無痛,但99趴無痛應該幾乎辦得到,而
10/14 12:22
→
yamakazi :
且我拿的例子是前一個人說的自適應濾波器,這幾乎百分百
10/14 12:22
→
yamakazi :
可以無痛轉
10/14 12:22
推
yamakazi :
而且自適應濾波器這東西早就出來幾十年了,搞不好年代還
10/14 12:23
→
yamakazi :
比python早,你說怎麼可能沒辦法用C/C++寫出來?
10/14 12:23
推
yamakazi :
而且你這例子和我內容天差地別,我是說有現成的python
10/14 12:34
→
yamakazi :
算法代碼,再請他生成測試資料,轉成C++還要做bit
true
10/14 12:34
你還是不懂寫程式的問題。
→
yamakazi :
,才不用審查代碼。
10/14 12:34
※ 編輯: oopFoo (36.224.199.125 臺灣), 10/14/2025 12:30:43
→
yamakazi :
你這例子沒有現成的代碼讓他閱讀,也沒有測資做bit
true
10/14 12:34
→
yamakazi :
,天差地別
10/14 12:34
推
yamakazi :
我拿leetcode
舉例好了,線上打這種程式競賽,幾乎測資
10/14 12:36
→
yamakazi :
過就可以,再來不要exception不要TLE,不要memory
leak
10/14 12:36
→
yamakazi :
,時間複雜度不要太誇張就過了,這種比賽哪有什麼評審去
10/14 12:36
→
yamakazi :
檢查你代碼?
10/14 12:36
推
yamakazi :
再來你自己寫算法也是要靠測資抓錯,寫leetcode大家都有
10/14 12:46
→
yamakazi :
經驗,一堆人一開始寫前幾筆測資ok,等到大點的測資一樣
10/14 12:46
→
yamakazi :
TLE,沒測資光靠人眼review根本看不出有什麼錯誤。
10/14 12:46
→
lazarus1121 :
讓AI寫寫method還行的吧,poc也能丟給他做
10/14 12:49
→
lazarus1121 :
出錯難免,但整體的確能省下滿多時間
10/14 12:49
→
oopFoo :
生成資料不會出問題?照例子寫不會出問題?test不會出問題
10/14 13:05
→
oopFoo :
?你錯了,有經驗的人都知道,ai出包的機會很大。
10/14 13:06
→
oopFoo :
Karpathy才剛說,nanoChat,沒辦法用ai寫,因為....
10/14 13:07
→
WTS2accuracy :
光說不用檢查ai產的扣就能end了
0價值言論
10/14 13:08
→
oopFoo :
"vibe
coding"之父,ai大神,沒辦法用ai來寫程式,你不覺
10/14 13:08
→
oopFoo :
的,你需要考慮一下你的假設。
10/14 13:08
推
yamakazi :
你給的連結是長這樣
10/14 13:27
→
yamakazi :
你的AI之父只用auto
complete,根本沒用Claude
codex
ag
10/14 13:29
→
yamakazi :
ent好不好
10/14 13:29
→
yamakazi :
只用tab
autocomplete生成的code?跟我假設天差地別
10/14 13:30
→
yamakazi :
也有可能我英文不好啦,不過看起來只用tab
autocomplete
10/14 13:31
→
yamakazi :
?
10/14 13:31
推
yamakazi :
他的「沒辦法用ai寫」好像跟我們認知的「沒辦法用ai寫」
10/14 13:50
→
yamakazi :
不太一樣,他說Claude
agent
didn’t
work
well,所以沒
10/14 13:50
→
yamakazi :
辦法寫,但具體怎樣不work也沒講清楚
10/14 13:50
推
yamakazi :
終於看懂前後文了,他是說他寫nanochat不用vibe
coding
10/14 13:56
→
yamakazi :
,不過你光講某個大神做某個專案不用Claude
agent其實沒
10/14 13:56
→
yamakazi :
什麼太大說服力,不過你高興就好
10/14 13:56
→
gino0717 :
南無阿彌陀佛
10/14 14:54
推
kuosos520 :
嗯嗯,請不要用,推廣大家手工寫code
10/14 15:35
推
tzouandy2818 :
哪個正常人會沒任何數據
卻開口就99趴99趴的叫
10/14 17:38
推
wizozd84070 :
雀食
10/14 18:23
推
abraxas :
英文都看不懂也出來跟人喊
99%
哦?
10/14 18:28
推
yamakazi :
拜託隨便給個X就要馬上看懂哦?
10/14 18:56
→
DrTech :
99%能取代推文又來了,拜託提出哪個論文或benchmark驗證出
10/14 18:59
→
DrTech :
99%,別靠
vibe
推文耶。
10/14 18:59
→
DrTech :
理性客觀討論,而不是靠"我感覺",來認為你的感覺是全世界
10/14 19:02
→
DrTech :
的事實。
10/14 19:02
→
DrTech :
拿一個濾波器演算法,來感覺全世界的程式碼都這樣,滿難說
10/14 19:04
→
DrTech :
服大家的。
10/14 19:04
推
yamakazi :
上面不都有98
100趴的了?
10/14 19:49
→
qqqlll666 :
AI就工具
難用就不要用
用下去變0.1還在用
那是人的問
10/14 19:52
→
qqqlll666 :
題還是工具問題
AI現在就是在快速進化
剛用多少要磨合
10/14 19:52
→
qqqlll666 :
磨合期抓短點
幾小時看不得效果就可以丟了
因為下個
10/14 19:52
→
qqqlll666 :
月會有更好的
10/14 19:52
推
yamakazi :
而且很弔詭的一件事,你找軟體工程師也不會說要求這個工
10/14 19:54
→
yamakazi :
程師一定要通過什麼benchmark
99%,實務上也幾乎沒有人
10/14 19:54
→
yamakazi :
類有辦法benchmark
99
10/14 19:54
推
alihue :
其實現在LLM寫程式的能力已經遇到瓶頸了,不存在幾年後就
10/14 20:02
→
alihue :
會更好的問題,除非推出新的AI且不需要大量資料訓練就能
10/14 20:02
→
alihue :
自己推理
10/14 20:02
推
qqqlll666 :
auto
complete
沒用?
叫他寫小scope的function沒用?
10/14 20:03
→
qqqlll666 :
複雜功能現在的確還是很爛
因為他不會主動問
不會查
10/14 20:03
→
qqqlll666 :
不會反抗
就算他不懂他還是會湊一個給你
因為AI訓練
10/14 20:03
→
qqqlll666 :
就是有猜有分
10/14 20:03
→
qqqlll666 :
想你對話那個問題
現在最法就是先叫他去survey
任何可
10/14 20:03
→
qqqlll666 :
能意外
然後再解決
10/14 20:03
→
qqqlll666 :
說實話你問一個人那個問題他大概只會問你要防啥
甚至
10/14 20:03
→
qqqlll666 :
直接叫你滾一邊去
10/14 20:03
→
alihue :
其實看領域,如果是前端LLM來做是從從容容游刃有餘,
10/14 20:05
→
alihue :
出
bug
通常不致命;後端出
bug
很多是很慘的
10/14 20:05
→
DrTech :
上面benchmark不都有98
100趴的了?
喔,某人真的看不懂英
10/14 20:11
→
DrTech :
文耶,快笑死。那個98%
100%的,都不是coding的測試阿。
10/14 20:11
推
yamakazi :
你人去做coding測試也不會99
100趴,如果限制時間搞不好
10/14 20:15
→
yamakazi :
人類還0趴
10/14 20:15
→
yamakazi :
舉個例,10分鐘寫三題leetcode
hard,就算很強的工程師
10/14 20:17
→
yamakazi :
可能一題都寫不出來,但十分鐘對AI來說綽綽有餘幾乎可以
10/14 20:17
→
yamakazi :
全對
10/14 20:17
→
DrTech :
所以AI可以完成99%的問題,到底在哪?
看不懂英文鬧笑話,
10/14 20:21
→
DrTech :
還跳針不回答大家疑問。
10/14 20:21
推
yamakazi :
奇怪了,我明明原文有下一些假設才能99趴,你都很喜歡自
10/14 20:24
→
yamakazi :
動放大解讀
10/14 20:24
推
DrTech :
AI大師
yamakazi真是超越OpenAI的強者,OpenAI的模型,都
10/14 20:25
→
DrTech :
做不到的事情,coding
benchmark通過率99%,yamakazi光靠
10/14 20:25
→
DrTech :
下prompt就超越了。真神人。
10/14 20:25
→
yamakazi :
有什麼好疑問的?反正不想用的人就繼續手寫我又無所謂。
10/14 20:26
→
yamakazi :
全世界最聰明的資料科學家和軟體工程師在開發的工具,我
10/14 20:26
→
yamakazi :
用就好了,少一個人用我少一個競爭對手很好啊
10/14 20:26
→
yamakazi :
覺得不到99趴就不要用很好啊,我幹嘛要幫你證明他有99趴
10/14 20:27
→
yamakazi :
然後還勸你去用XD
10/14 20:27
→
DrTech :
現在又跳針:不是99%是大家誤解了。
10/14 20:28
→
DrTech :
跳針:我說99%是對的,但我幹嘛證明99%是對的。真是笑死人
10/14 20:29
→
DrTech :
。
10/14 20:29
推
yamakazi :
你開心就好XD
10/14 20:29
推
Romulus :
蛤
上面那張圖和準確率完全無關耶
那是Benchmark比較耶
10/14 20:40
推
Romulus :
應該說那是比賽的準確率
俗稱滿分100分得幾分
10/14 20:43
→
Romulus :
這和你內文講的99%準確也差太多了
根本移花接木等級
10/14 20:44
→
Romulus :
而且每項表現不一樣
每項每個AI又不一樣
拿這個表出來說
10/14 20:45
→
Romulus :
這漏陷了吧
本來啥都不講還能把人唬的一愣一愣的
10/14 20:45
→
Romulus :
現在不就被看破手腳在超級亂吹
10/14 20:46
推
Romulus :
我工作上用Vibe做沒接觸過的領域&生架構然後review修
10/14 20:49
→
Romulus :
用得很高興也很好用
就不懂為什麼這群人要一直拿AI現在
10/14 20:49
→
Romulus :
根本還做不好的領域一直膨風
10/14 20:50
推
shortoneal :
我自己也是認為工具多碰,但是要上production這種事情
10/14 20:50
→
Romulus :
然後戳他牛皮就說好啊那你就不要用
講的好像他們的AI用法
10/14 20:50
→
Romulus :
才是對的
不照他們的用法沒那麼神就是不會用&不要用
10/14 20:50
→
shortoneal :
未來可期就是未來再用,別逼自己甚麼都要用
10/14 20:50
→
Romulus :
不熟的SDK叫AI生code比自己一個一個查文件那可快太多了
10/14 20:51
→
Romulus :
還不需要自己去餵食文件
反正Microsoft
Learn上都有
10/14 20:52
推
ikachann :
通常我會先寫雛形
請ai把它完成
10/14 21:21
→
wuyiulin :
講
LeetCode
就是沒遇過
edge
case
10/14 23:20
→
wuyiulin :
我覺得現在刷
LeetCode
最大的好處就是讓自己面對更難的
10/14 23:21
→
wuyiulin :
問題、寫程式考慮更周全
10/14 23:21
→
wuyiulin :
現實中比
LeetCode複雜的問題難了去,一般
LLM
還解不了
10/14 23:21
→
wuyiulin :
新週賽問題。
10/14 23:22
→
wuyiulin :
humble
啦
dude
10/14 23:23
推
viper9709 :
怎麼吵起來了@@
10/15 00:51
推
SkankHunt42 :
ptt最友善的板
10/15 04:14
→
oopFoo :
也不是吵,只是想糾正被洗腦的部份,就像aime
2025是100%
10/15 07:13
→
oopFoo :
但那不是寫程式的benchmark,tau2-bench的telecom是98%,
10/15 07:14
→
oopFoo :
但那是agent
tool的benchmark。現在agent
coding其實是亂
10/15 07:15
→
oopFoo :
槍打鳥的方法。反正ai不會累,就一直亂打,寫到程式passed
10/15 07:17
→
oopFoo :
test為止。想糾正沒有真正操作ai
coding的人的錯誤認知。
10/15 07:20
→
oopFoo :
其實ai
coding還蠻有意思的,作為輔助蠻適合的,但想取代
10/15 07:24
→
oopFoo :
人還要等下個突破。我等自駕等10年了,再等10年看看。
10/15 07:26
→
DrTech :
yamakazi
連tool
use是什麼都不知到,就在喊
AI
coding是9
10/15 08:41
→
DrTech :
8%了。認真討論他也看不懂啦。
10/15 08:41
→
DrTech :
Claude
在
swe-bench
verified
資料集,最高跑到82%通過率
10/15 08:47
→
DrTech :
。台灣y大神超越世界知名公司,達到99%。真神人。
10/15 08:47
推
lwecloud :
糾正被洗腦(X
宗教戰爭(O
10/15 09:10
推
yamakazi :
糾正被洗腦XD
10/15 09:13
→
yamakazi :
我claude
4,4.5用到現在,每一行都有review
,這樣叫沒
10/15 09:15
→
yamakazi :
用過ai
coding
XD
10/15 09:15
→
yamakazi :
99趴是相對人類啦,AI
82,一般人類去寫還不知道多少勒
10/15 09:16
推
sperma :
對某些人來說實事求是很困難的
承認自己錯了就好像自己輸
10/15 09:17
→
sperma :
了
低人一等一樣
妙的是這種人通常都是半桶水
連基本英文
10/15 09:17
→
sperma :
閱讀都有問題
跟我說多會寫
code
騙鬼吧XD
10/15 09:17
推
yamakazi :
人類方也沒提數據啊,人類有SWE
bench可以看分數?
10/15 09:36
→
yamakazi :
人類自己都沒有benchmark
卻可以覺得人類自己做得比ai好
10/15 09:36
→
yamakazi :
才奇怪吧
10/15 09:36
→
yamakazi :
一堆東歐俄羅斯人英文不好,code照樣寫得嚇嚇叫好嗎
10/15 09:37
→
brucetu :
寫扣跟英文相關性真的沒那麼強
10/15 10:10
→
brucetu :
技術文件的英文都很清晰直白
真的看不懂還可以翻譯
10/15 10:10
→
brucetu :
英文社群媒體的內容或是新聞理解能力就只是看你有沒有常
10/15 10:13
→
brucetu :
在看而已
沒什麼好驕傲的
一天15分鐘滑幾篇廢文就練起來
10/15 10:13
→
brucetu :
了
10/15 10:13
推
yamakazi :
人類寫扣某種程度也是試錯亂槍打鳥,很少有人類可以一次
10/15 10:13
→
yamakazi :
寫對的,還不是要靠編譯器檢查,測資糾錯,上網查算法或
10/15 10:13
→
yamakazi :
用法
10/15 10:13
推
WTS2accuracy :
也沒有洗腦不洗腦啦
AI無腦吹也就那幾個沒料的
10/15 11:43
→
WTS2accuracy :
剩下的都在看笑話而已XDD
是要怎麼被洗腦
10/15 11:43
推
lturtsamuel :
一個
type
hint
能解決的事情,ai
竟然不知道...?
10/15 13:07
→
DrTech :
所以AI寫程式正確率99%,到底在哪?
講半天一直跳針不回答
10/15 16:01
→
DrTech :
。
10/15 16:01
推
HaHadog :
python底層是c所以轉起來很容易
怎麼不說所有語言底層都
10/15 16:47
→
HaHadog :
是1跟0大家都一樣
想轉隨便轉笑死
10/15 16:47
→
legnaleurc :
AI仔會跟你說就算現在不行,
以後一定可以
10/16 00:30
推
viper9709 :
原來AI寫程式是這樣喔@@
10/16 01:04
推
expiate :
真的佩服你們這些人浪費時間跟槓精討論,我都是看笑話的
10/16 10:18
→
expiate :
。
10/16 10:18
推
Romulus :
講不過就開始避重就輕,轉移焦點,顧左右而言他
10/16 10:54
→
Romulus :
超級標準的完全沒料ptt牛王
10/16 10:54
推
NDark :
之前是
不是百分之百就是沒取代
10/16 11:05
→
NDark :
現在有退讓了
1%
算是努力有成果
10/16 11:05
→
yamakazi :
樓上XD
10/16 19:16
推
ripple0129 :
算力最終會解決一切啦,產一段扣,自動refine個千萬
10/17 03:00
→
ripple0129 :
次,99%真的不是問題,問題是浪費算力
10/17 03:00
推
NDark :
這個世界浪費的事還少做嗎
10/18 22:12
→
NDark :
希望這輩子看得見
核融合/戴森環的世界
10/18 22:13
推
pot1234 :
即便很爛,我還是覺得寫的比我們新人好
10/19 21:07