[新聞] 資深軟體工程師用Cursor工作效率降19%

看板: Soft_Job

作者: xephon (Usagi)

標題: [新聞] 資深軟體工程師用Cursor工作效率降19%

時間: Wed Jul 16 09:11:00 2025

https://www.bnext.com.tw/article/83885/ai-productivity-drop

AI變豬隊友？資深軟體工程師用Cursor「工作效率降19%」：背後原因是？導入AI錯了嗎？

2025.07.15

資料來源：METR、路透社

責任編輯：李先泰

內文：

重點一：2025年初AI工具讓資深開源開發者生產力下降19%，顛覆普遍預期。

重點二：研究採用嚴謹隨機對照試驗（RCT），直接測量AI在真實軟體開發情境的影響。

重點三：研究結果與AI基準測試及開發者主觀經驗存在顯著差異，凸顯評估AI效益需多元視

角。

生成式AI近年有越來越「聰明」的趨勢，不少企業甚至因為導入AI而縮減組織人員規模。但

對於公司行號來說，真的只要「無腦導入AI」，就可以讓生產力大躍升嗎？答案可能沒這麼

簡單。

7月10日，一項由非營利研究機構METR（Model Evaluation & Threat Research）主導的研

究顯示，2025年初問世的AI工具，包括Cursor Pro與Claude 3.5／3.7 Sonnet等前沿模型，

實際應用於資深開源開發者日常開發工作時，非但未能提升生產力，反而導致效率平均下降

19%。

這份研究的隨機對照試驗（Randomized Controlled Trial, RCT）結果，狠狠打臉產業普遍

認為「AI將大幅加速軟體開發」的主流觀點。白話來說，就是強制相對資深的老手工程師使

用AI，反而可能拖累他們的工作速度。

https://i.meee.com.tw/f063wYI.jpg

Y軸代表「使用 AI 後的時間變化」。可以發現，當開發者實際使用 AI 工具（來完成任務

時，所需時間反而增加了 19%。

問題是，為什麼有如此反直覺的結果？是在使用AI的過程中，出了什麼差錯嗎？

拖累老手工程師的5大潛在原因

為深入分析AI工具對軟體開發生產力的實際影響，研究團隊招募了16位長期參與大型開源專

案（平均22,000顆GitHub星、百萬行程式碼）的資深開發者，針對246個專案真實議題（如

錯誤修復、功能開發、程式碼重構），隨機分配為「允許使用AI」與「禁止使用AI」兩組。

開發者可自由選擇AI工具（主要為Cursor Pro搭配Claude 3.5/3.7 Sonnet）。同時，開發

者在執行任務時全程錄影，並自行回報所需的總實作時間，並比較同一批開發者在「無AI輔

助」下完成任務的時間差異，並排除潛在實驗偏誤。

受試者在實驗前普遍認為，AI能讓他們加快24%進度，即使在實驗過後，仍普遍認為允許使

用AI可讓實作時間縮短20%。但研究數據卻顯示，實際上允許使用AI反而讓完成時間增加了1

9%。也就是說，這些軟體工程老手在使用AI工具時，反而變慢了。

根據研究結果，這些老手「被AI拖累」的原因有以下五點：

1. AI工具使用流程增加額外步驟：開發者在與AI互動、理解AI回應、驗證建議內容時，會

花費額外時間。

2. AI建議需反覆修正：AI產生的程式碼或建議往往不完全符合專案需求，開發者需多次修

改、整合或重寫。

3. 高品質標準下AI表現有限：在大型、成熟的開源專案中，對程式碼品質、測試、文件等

要求高，AI生成內容較難一次達標，需人工補足。

4. 隱含需求難以明確傳達給AI ：專案中有許多隱性規範或背景知識，AI難以完全掌握，導

致開發者需花時間解釋或修正。

5. 學習與適應成本：即使開發者已有AI工具經驗，仍需適應新工具或新工作流程，短期內

可能降低效率。

要說明的是，參與者雖有AI經驗，但其實多數僅使用Cursor數十小時經驗而已。因此可以

說，有經驗老手若還不太熟悉使用AI編程工具如Cursor，在他們熟悉的領域內，其實不用AI

的效率反而更好。

因此可以說，現在企業普遍認為「導入AI必能提升生產力」的假設，其實有待商榷。

https://i.meee.com.tw/xX1Hjvg.jpg

研究顯示，對於自己越熟悉的問題，資深開發者的速度反而被 AI 拖得越慢。他們也回報說

，正是因為自己太有經驗，導致 AI 很難真正幫上忙。

結論：無腦導入AI可能弊大於利

總結來說，這項研究的最大發現是，即使已經是程式開發老手，光是嘗試使用所謂Vibe Cod

ing工具本身就一種全新的技能，這種與AI協作進行軟體開發的實作，相較以往是具顛覆性

的，企業主在導入相關AI工具時仍需考量團隊及專案得適切性，否則很可能只是搞的團隊人

仰馬翻，甚至錯估導入AI的成效，最可怕的是誤殺忠良，讓有能力的工程師被誤會「不懂AI

」。

但不要誤會了。這份研究是針對「老手工程師」對於「使用AI工具」的評估，因此無法代表

所有開發者或不同類型專案。同時，研究僅針對開發者在自己熟悉的專案中處理真實議題，

故結果也不適用於新手、跨領域協作或陌生專案等情境。

另外值得注意的是，部分開發者獲知實驗結果後反映，使用AI工具讓開發過程更有趣或更具

互動性，即使未提升效率，仍願意持續嘗試，為未來更強大的AI系統做準備。

看到這邊，還認為AI是效率萬靈藥嗎？如果是，你可能需要好好想想。

心得：

這篇研究蠻有趣的，不知道跟大家體感差多少

我朋友的公司是強力導入AI開發後

宣稱已達到工程師效率提升30%

但他們沒有把產品上市時間縮短30%

是用減少10%工程師跟多做20%事情來達成

具體怎麼算的可能只有高管知道了

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.216.162.50 (臺灣) ※ 文章網址 ※

推 chyl13579 : 或許對於資深工程師來說，寫code比寫prompt 更快吧， 07/16 09:15

→ chyl13579 : 尤其這次實驗的是他們熟悉的專案 07/16 09:15

推 chita0258 : 多的20%時間差不多就是學習的成本吧 07/16 09:29

推 s8911090 : METR從名字看就不像會客觀研究的 07/16 09:45

推 fake01 : 有感，工程師會使用AI來進行function的重構，會讓code變得 07/16 09:49

→ fake01 : 較難閱讀，當在審視PR的時候，需要較多的時間來理解重構 07/16 09:49

→ fake01 : 後的內容是否有達成需求以及範蓋邊界條件 07/16 09:49

推 ILoveAMD : AI常常想太多容易出現無效的程式碼 07/16 10:20

推 stepnight : 以前資深RD只需要講個幾句沒重點的 07/16 10:31

→ stepnight : 就有初階RD幫你通靈完成需求 07/16 10:31

→ stepnight : 現在你需要鉅細靡遺的對著AI講出需求 07/16 10:31

→ stepnight : 哪個比較快不用比吧？ 07/16 10:31

推 shadow0326 : 資深工程師開課介紹各種AI用法的收入應該可以提升30% 07/16 11:16

推 abc0922001 : AI就是實習助理工程師，輔助用的而已 07/16 11:45

推 hobnob : 笑死，s說的通靈真的有感 07/16 12:06

→ ma721 : 用幾十小時也叫老手 07/16 13:07

→ airtsubasa : 我都拿來寫自己也看不懂的註解讓人以為我棒棒負責 07/16 14:43

推 viper9709 : 簡單講就AI不會通靈XD 07/16 16:23

推 devilkool : 現在已經一堆資深的開課教AI賺FOMO仔的錢啦 07/16 16:24

→ Ekmund : 不就前幾天oopFoo貼的？ 07/16 17:09

推 neo5277 : 這些都是溝通問題啊..... 07/16 17:37

推 oopFoo : 原因，理由都是推測。這個實驗重點是，每個參與人員，做完 07/16 17:50

→ oopFoo : 後，自我評估工作效率是+20%+，但實際是-19%。 07/16 17:52

推 oopFoo : 我不會說ai泡沫要破滅，但確實最近有點消風。 07/16 17:55

推 gn00273680 : 開課噱海囉但免費資源很多啦而且一直變變變沒必要 07/16 20:20

→ gn00273680 : FOMO 07/16 20:20

推 gino0717 : 覺得AI能做就跑去摸魚了實際效率下降十九趴 07/16 20:22

推 NDark : 我覺得蠻多持平之聲都很中肯 07/16 20:46

→ NDark : 對於自己比較不擅長的領域AI會幫忙很大 07/16 20:46

→ NDark : 譬如說我不會寫宣傳文 AI可以幫我寫出情緒價值滿滿的文章 07/16 20:47

→ NDark : 對於我不熟的資訊類其他工作也表現得不錯 07/16 20:48

→ NDark : 因為我有基礎的知識知道該怎麼跟AI互動會得到最好結果 07/16 20:48

→ NDark : 但是對於我已經做了十年的工作短時間很難直接套用AI 07/16 20:49

→ NDark : 就算改變工作方式套了AI產量變10倍 07/16 20:49

→ NDark : 這時候碰到非生產的其他瓶頸幾乎是100% 07/16 20:50

→ NDark : 如果不妥協硬推下去那一定是偷懶或是接案或是離職創業之路 07/16 20:51

→ bitcch : http://i.imgur.com/ZB1tQ1L.jpg 07/16 22:09

推 sunsamy : AI在"抽象"方面表現不錯，像藝術跟唬爛表現不錯 07/17 00:37

→ sunsamy : 但是要求"精確"的事，如寫程式卻是"抽象"化了 07/17 00:37

推 sunsamy : 所以像code review沒意外的話也會蠻唬爛的 07/17 00:42

→ sunsamy : 除非本身就用Lint tool輸出的結果然後用LLM講述給你聽 07/17 00:42

→ sunsamy : 但那本身就是Lint tool的功勞, 不是AI的功勞 07/17 00:42

推 lin80673 : 有時候多問幾次LLM就開始產生幻覺，一直給我無效的Code 07/17 00:54

推 yueayase : 這樣老闆應該會火掉這些用AI效率變差的工程師吧? 07/17 02:00

推 Murasaki0110 : 大project需求要講精確太難了 07/17 07:32

→ Murasaki0110 : 最好用就是臨時要寫個script或tool 07/17 07:32

推 rereterry : 幫忙直接撰寫驗證部分其實滿有幫助的，瞬間幫你配置好 07/17 10:54

→ rereterry : 好，直接複製貼上就行了，其他的，只能說還是容易唬爛 07/17 10:54

→ rereterry : ，需要重複檢查 07/17 10:54

推 viper9709 : 大project需求要講精確太難了+1 07/17 15:41

推 jhjhs33504 : 大project需求要講精確的難度可能會比寫好rust還高喔~ 07/17 18:56

推 acgotaku : Cursor 想棄坑了一直搞限速降速

寧願去充值 Claude 07/17 19:00

→ xephon : 需求叫PM寫 07/18 00:42

推 louner : 用來寫一些單純但需要查查找找的snippet非常方便大多一 07/18 06:54

→ louner : 次就過最起碼讓他寫再改而不是全部自己寫省了我不少精力 07/18 06:54

→ louner : 上層想推只是裁員的藉口而已但若真的能節省大量人力也不 07/18 06:55

→ louner : 見得是壞事因為創業門檻會降低 07/18 06:56

推 louner : 就工作複雜程度來看 AI更能取代的應該是管理職 PM這類非I 07/18 07:00

→ louner : C類型工作但沒人會灑錢資助這類研究原因大家都知道 07/18 07:00

→ acgotaku : cursor 在翻陳年老扣沒文件叫他解釋某單元怎麼實作 07/18 14:09

→ acgotaku : 怎麼呼叫他的回傳值長怎樣給個範例還是超級好用 07/18 14:10

推 NDark : 推樓上，老工程師的經驗說會受到挑戰 07/18 17:06

推 wulouise : cursor可以畫function內flow chart嗎？ 07/18 20:46

推 guanting886 : 現在ai 已經進步到你丟給他obfuscate過的code他還有 07/18 21:31

→ guanting886 : 辦法解回來了看沒文件的程式碼應該他蠻會猜的至少 07/18 21:31

→ guanting886 : 縮短你通靈時間 07/18 21:31

推 WWIII : 一直寫需求就是pm的工作當然不習慣 07/18 22:21

推 Romulus : 我最近才用Claude和Gemini Pro瘋狂通靈失敗都在胡說八道 07/19 01:16

→ Romulus : 這研究是以老手寫熟悉的前提這邊現在AI價值不高是真的 07/19 01:16

→ Romulus : 寫的人越不懂AI價值就越高都懂了直接寫code就好找AI幹嘛 07/19 01:17

推 abc01251 : 對支持！你們不要用我用就好 07/19 01:18

推 sowulo : 有時候一直反覆修正的時候都在想這個時間自己寫早就寫完了 07/19 20:03

→ sowulo : 不過也確實人都不一定完全懂需求了再多轉一手給AI勢必會 07/19 20:03

→ sowulo : 再偏差更多只能說還有一段路要走不管是人類如何使用AI或 07/19 20:03

→ sowulo : 是AI本身 07/19 20:03

推 xoyo : 現在的 AI 就是 Junior 甚至不到 07/19 21:18

→ Obama19 : 高手都改用claude code了研究總是落後一步 07/19 23:20

→ TSMCfabXX : 假設原本開發工作100分鐘使用 AI 可省 30分鐘 07/19 23:54

→ TSMCfabXX : 但因為要做新的精美投影片來宣稱 AI 加速的效果 07/19 23:54

→ TSMCfabXX : 來回多花了半小時 07/19 23:54

推 viper9709 : 樓上XD 07/20 01:25

推 jacklin2002 : 每次跟AI講，你這個地方錯了，只會回：抱歉！您說的 07/20 08:19

→ jacklin2002 : 是對的，我再幫您...有夠狗腿 07/20 08:19

推 stepnight : 然後下次還是繼續鬼打牆出錯 07/20 09:25

推 secrectlife : Ai做錯了還會一副好像正確的樣子 07/20 13:05

推 Goodwater : AI寫code bug無敵多要一直無限修正 07/21 10:38

→ strlen : 很多人以為自己寫的code bug少喔呵呵呵是不是太看得起自 07/21 18:03

→ strlen : 己啊 07/21 18:04

→ strlen : 人類遲早要輸的大神就少數絕大多數工程師又慢又粗心 07/21 18:04

→ strlen : bug滿天飛寫測試唉唉叫改個設計推拖拉有沒有這種人？滿 07/21 18:05

→ strlen : 地都是不要再騙自己了你可能不是但你同事呢呵 07/21 18:05

→ strlen : 軟體最強的那幾間通通都在推AI 你以為你是誰啊笑死 07/21 18:06

→ strlen : 你公司的程式品質有那幾間巨頭好喔說出來我笑笑 07/21 18:06

→ strlen : 同樣兩人份需求要你帶一個一年以下的Jr跟給你無限次數的 07/21 18:07

→ strlen : claude AI 想也知道哪個比較輕鬆帶人多痛苦啊 07/21 18:07

→ strlen : 還工作效率降19%勒不然來比一個資深用AI 一個資深帶Jr 07/21 18:08

→ strlen : 來看看效率差多少 07/21 18:09

→ strlen : 結果帶Jr的 Jr也全都用AI寫給你哈哈哈哈 07/21 18:09

→ lturtsamuel : jr 會學習啊你公司差只找得到糞 jr 怪誰不培育 jr 07/22 01:28

→ lturtsamuel : 等老鳥都退了公司產品直接關起來？ 07/22 01:28

→ lturtsamuel : 如果真的追求極限效率根據這篇的研究就是不要用ai也 07/22 01:32

→ lturtsamuel : 不要找jr 叫老鳥自幹 07/22 01:32

→ ChungLi5566 : 這些研究都過時了 AI每個月都在進步 07/24 22:32

推 xluds24805 : 一開始總要有學習時間吧 07/26 20:22

推 Wishmaster : 太難評量了,AI也是需要調教的,開箱即用結果真的爛 07/27 11:37

推 refusekkk : 回wulouise:現在AI可以從spec生出mermaid語法算嗎? 07/29 03:53

推 qmailtw : 我拿

cursor 當高級 grep. 結果是不是亂掰？一看就知道 08/09 13:12

→ qmailtw : 。我基本上不用 ai 生 code, 但幫我讀 code 能省下不少 08/09 13:12

→ qmailtw : 時間。 08/09 13:12

Soft_Job / PTTBBS 推薦

[新聞] 資深軟體工程師用Cursor工作效率降19%