MenTalk / PTTBBS 推薦

[閒聊] 最近用LLM

看板: MenTalk

作者: claymath (ヽ(‵・ω・′)ゝ)

標題: [閒聊] 最近用LLM

時間: Wed Jan 7 23:05:00 2026



最近剛好一段時間同時在用 Gemini 跟 GPT,本來想說算了也沒什麼好寫的,但 Gemini 用久了真的會讓人忍不住想記錄一下,算是自我療傷。


先講清楚,我不是什麼模型分析派,也沒在算參數量,我就是一個實際坐在那邊跟它聊天、然後一直被打斷的人。


Gemini 給我的最大感想不是它笨,

是它很不可靠。


那種不可靠不是「答錯題」,而是你永遠不知道下一句它還是不是同一個人格。


有時候你們聊得好好的,它下一輪突然失憶;

同一句話重問三次,它可以給你三種完全不同宇宙觀的答案;

更煩的是,有時你會開始懷疑是不是自己中文退步,不然怎麼會被理解成那樣。


用到後面真的會出現一個念頭:

「靠北,現在是我在用模型,還是模型在訓練我?」


你會開始修正自己講話方式、調整提示、避開某些說法,最後發現不是你要答案,是你在配合它的情緒。


然後還有 session 問題。

那個對話連續性真的很迷,有時像是還在同一串,有時又像直接換了一個模型接手,前面講的東西當沒發生過。

可能是系統還有bug 常常卡一半後面就中斷

再後來就資料整串不見


整體感覺就是:

算力很大,但心智狀態很飄。


反觀 GPT,我不會說它多神,但至少它給人的感覺是「同一個人從頭跟你聊到尾」。


它也會答錯,但錯得很合理;

它也會卡,但會告訴你它卡在哪;

你不太會有那種「我現在到底在跟誰講話?」的困惑。


當然 GPT 免費版額度是真的很摳,有時聊到一半被砍也很煩,但老實說我比較能接受「我被限制」,而不是「我被亂搞」。


就是 你是有明確知道限制的狀態


gpt 對齊問題跟理解問題能力還是高出Gemini一級

虧我當時以為跟其他人團了3250/6人份的gemini可以高枕無憂


結果我只是找了一個新進員工

他產出我還要前後看很多次

不過好在一年份下來才541 沒花多少錢

但整個成效 比gpt降版本的模型還差了一截

Gpt整體感覺像是你還有一個大腦幫你想全面性的問題…整體感差很多

-----

Sent from JPTT on my iPhone


--

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.226.198.43 (臺灣) ※ 文章網址 ※
yggyygy : 絕們奶真的爛到沒資格站上同一個平台討論 01/08 10:46
yggyygy : 微軟那個還好一點點 01/08 10:47
freshguy : 我不知道用AI要怎麼幫我工作…我只會用來問資料性的問題 01/09 00:03
freshguy : ,偶爾生圖玩或是叫他寫詩文 01/09 00:03
freshguy : 能不能跟我說花錢買算力要算什麼? 01/09 00:04
takomalu : 我用Gemini 幫我翻遊戲字串 好像比ChatGPT 通俗一點 Cha 01/09 10:24
takomalu : tGPT 有時候翻出來很硬 明明要求台灣通俗的口語 01/09 10:24
heartlock : Gemini的設計者可能患有ASD,創造出如ASD思考邏輯的AI 01/11 02:21
lazybr : 最近知道有個Grok可以玩 01/11 14:30
KasmirLo : Gemini當生圖器玩就好 01/11 18:39