發表文章

Can a Free Model Carry the Grunt Work? GLM-5.2 vs GPT-5.5 Codex, three delegation tasks

Delegation Benchmark · 2026-07-04 · English edition Can a Free Model Carry the Grunt Work? GLM-5.2 vs GPT-5.5 Codex, three delegation tasks Video version (4 min): https://youtu.be/sRqLns96NQM Context: our main coding agent runs on a limited subscription, so we delegate typing-heavy and file-reading work to models on NVIDIA NIM's free tier — the expensive model only writes specs and does acceptance. When z-ai shipped GLM-5.2 we re-ran our delegation eval, with OpenAI Codex CLI (gpt-5.5) as the paid baseline. Every prompt and acceptance test is included below — rerun it yourself. GLM-5.2 totals 93 / 97 / 82 Generate / Read / Modify (out of 100) Codex totals 95 / 95 / 88 Generate / Read / Modify (out of 100) Functional accuracy Both perfect 36 acceptance checks, zero misses on either side Cost $0 vs paid NIM free tier vs ChatGPT subscription quota 00 One-sentence verdict Free GLM-5.2 now matches GPT-5.5 Codex on functional quality (both aced a...

免費模型能扛多少粗活? glm-5.2 × GPT-5.5 Codex 三類委派實測

Delegation Benchmark · 2026-07-04 · 繁體中文 免費模型能扛多少粗活? glm-5.2 × GPT-5.5 Codex 三類委派實測 影片版(4 分鐘): https://youtu.be/2uh8l6u54VE 背景:Claude Code 訂閱 token 有限,我們把「打字與讀大檔」外包給 NVIDIA NIM 免費層的模型,Claude 只負責寫規格與驗收。z-ai 出了 glm-5.2 之後,我們用三種真實委派任務重測,並以 OpenAI Codex CLI(gpt-5.5)同題對照。 全部題目與評分標準都附在文末,歡迎自己重跑。 glm-5.2 三類總分 93 / 97 / 82 生成 / 閱讀 / 修改(滿分 100) Codex 三類總分 95 / 95 / 88 生成 / 閱讀 / 修改(滿分 100) 功能正確率 雙方全滿分 36 個驗收檢查點,兩邊 0 失誤 成本 $0 vs 付費 NIM 免費層 vs ChatGPT 訂閱額度 00 一句話結論 免費的 glm-5.2 在功能品質上已與 GPT-5.5 Codex 同檔次(36 個驗收點雙方全過),分差全在「工程品格」細節:glm 會編造時間戳、時間變異極大(33 秒到 23 分鐘);Codex 時間穩定、後設資訊誠實,但這次被抓到寫完不自測。 在「省 token」前提下,glm-5.2 配上機械化驗收(lint 腳本+diff 檢查)已足堪日常委派;Codex 留給急件與需要可稽核根因的場合。 01 方法 項目 glm-5.2 GPT-5.5 Codex 存取途徑 opencode CLI → NVIDIA NIM 免費層( z-ai/glm-5.2 ) OpenAI Codex CLI 0.139.0( gpt-5.5 ,reasoning medium) 執行形式 headless、同一份 prompt、各自獨立的乾淨工作目錄、可用本機 shell 工具 出題與驗收 由 Claude(Fable 5)設計:標準答案先於測試存在;受測模型拿不到測資與評分標準 驗收環境 PHP 任務雙環境驗收:Windows 本機 PHP 7.3.30 + Debian 13...

開源新作:Clipboard Vault Sync — 複製即存,剪貼簿自動同步到 Obsidian

圖片
複製即存,永久保留。 我開源了一個 Windows 系統匣小工具: Clipboard Vault Sync ——它監看你的剪貼簿,把你複製的所有東西(文字 和圖片 )自動存進 Obsidian vault,變成一則一則帶時間戳的 Markdown 筆記。 為什麼不用 Obsidian 外掛就好? 因為外掛只有在 Obsidian 開著的時候才能收集。這個工具常駐系統匣,整天默默工作——你白天到處複製資料,晚上打開 vault,筆記已經整整齊齊躺在那裡了。 特色 📋 自動收集 ——每次複製自動存成一則筆記(每筆一檔,檔名含日期時間) 🖼️ 圖片也收 ——截圖自動轉 AVIF 格式省空間,筆記內直接顯示 🧠 去重 ——同樣的內容永遠只存一次,連重開機都記得 📁 彈性目標 ——可同步到 vault 內任何子資料夾(例如你的 inbox) ⌨️ 全域快捷鍵 ——設定視窗點一下欄位、按下組合鍵就完成錄製 🔒 100% 本地 ——無網路連線、無遙測,程式碼全開源(MIT),歡迎查驗 誠實提醒 它會存下你複製的 所有 東西——包括密碼等敏感文字。複製機密前請先從系統匣退出程式,或事後刪掉那則筆記。暫停開關與敏感內容過濾已在開發路線圖上。 下載 到 GitHub Releases 下載免安裝的 portable exe(約 88 MB,雙擊即用)或安裝檔。目前支援 Windows;程式碼用的都是跨平台 API,macOS/Linux 理論可跑,歡迎回報。 English Copy anything, keep it forever. I open-sourced Clipboard Vault Sync — a Windows system-tray app that watches your clipboard and saves everything you copy (text and images ) straight into your Obsidian vault as timestamped Markdown notes. Why not just use an Obsidian plugin? Because plugins only capture ...

Keep Claude Code's prompt cache warm while idle — meet cwarm

Keep Claude Code's prompt cache warm while idle — meet cwarm If you use Claude Code , you've probably hit this: you're deep in a session, step away for a meeting, come back — and it feels like it re-reads the entire conversation before answering. That's a prompt-cache miss . Why it happens Anthropic's prompt cache has a time-to-live: roughly 1 hour on Max and 5 minutes on Pro . Idle past that and the cache expires, so your next turn pays the full cost of re-reading the context. On macOS/Linux you can poke the session with something like tmux to keep it warm — but on Windows-native (Git Bash) there was no clean path . That's where cwarm started. What cwarm does It runs claude inside a pseudo-terminal (PTY) it controls, and when you've been idle past your plan's threshold it injects a tiny keepalive so the cache stays warm. The key part: the injection is an in-process PTY write , unrelated to window state — so it keeps working when the window i...

讓 Claude Code 的 prompt cache 不再「放著就冷掉」——開源小工具 cwarm

讓 Claude Code 的 prompt cache 不再「放著就冷掉」——開源小工具 cwarm 用過 Claude Code 的人應該都有這經驗:寫到一半離開去開會、回來繼續,結果它好像「重新讀了一遍整個對話」才回你——這就是 prompt cache 過期 (cache miss)。 為什麼會這樣? Anthropic 的 prompt cache 有存活時間(TTL): Max 約 1 小時、Pro 約 5 分鐘 。閒置超過就過期,下次互動得重付一次「讀完整上下文」的成本。Mac/Linux 的人可以用 tmux 之類的方式定時戳一下保溫,但 Windows 原生(Git Bash)沒有這條路 ——這就是我寫 cwarm 的起點。 cwarm 做什麼? 它把 claude 跑在一個自己控制的 PTY(虛擬終端)裡,當你閒置超過方案門檻時,自動注入一個極小的 keepalive 讓 cache 不過期。重點是—— 注入是行程內部的寫入,跟視窗狀態無關 :你把視窗縮到工作列、切到別的桌面、它在背景,照樣保溫;只有真正關掉視窗才會停。 一個有趣的技術坑 一開始我想「直接對終端視窗送鍵盤訊息不就好了?」結果 mintty (Git Bash 的終端)跟 PuTTY 一樣, 完全無視外部合成的鍵盤訊息 ( PostMessage / SendMessage /甚至 WM_PASTE 實測全不通),而 SendInput 又得搶焦點。最後的結論跟 tmux/expect/VS Code 終端用的是同一招—— 你得自己當那個 PTY 的主人 ,才能乾淨地把輸入餵進去。 特點 跨平台 :Windows / macOS / Linux, 不需要 tmux (已在 Windows 與 Raspberry Pi 4 / Linux aarch64 實測)。 自動依方案調門檻 :Max 約 58 分、Pro 約 4 分才注入,且有冷卻。 焦點/縮小/背景都照常保溫 。 選配「cache 倒數」statusline :會包裝你現有的、不偷蓋、可一鍵還原。 安裝 & 使用 npm i -g claude-cache-keepalive cwarm ...

自架跨裝置-obsidian-同步windows--raspberry-pi--android--iphone哪些行得通哪些是死路為什麼

自架跨裝置 Obsidian 同步(Windows + Raspberry Pi + Android + iPhone):哪些行得通、哪些是死路、為什麼 一份 2026-06 的實戰紀錄:把同一個 Obsidian vault 自架、免費地,同步到一台 Windows 桌機、一台 24 小時開機的 Raspberry Pi、三台 Android 手機、一台 iPhone。 這 不是 又一篇「快樂路徑」教學——各工具的官方文件都寫得很好。這篇補的是平常少有人寫的部分: 那些撞牆的死路、為什麼別走、以及各平台特有的陷阱 (尤其是 ARM 樹莓派和 iOS)。如果你正要做同一件事,這篇大概能幫你省下好幾個晚上。 作者:fifthadj。歡迎自由取用,不負任何保證——工具更新很快,請把這篇當「某個時間點的快照」,不是會維護的權威指南。 先講結論——最後行得通的方案 裝置 同步方式 Windows 桌機 Syncthing (同時兼任 iOS 的「橋」,見下) Raspberry Pi 4(24 小時開機的 Linux 中樞) Syncthing 中樞 + CouchDB (給 iOS 用) Android 手機(×3) Obsidian App + Syncthing-Fork iPhone Obsidian App + Self-hosted LiveSync ↔︎ CouchDB 兩套同步刻意並存: 桌機 + Android → Syncthing。 點對點、即時、雙向、私密(走 mesh VPN)。Android 的 Obsidian 可以「 Open folder as vault 」,直接開 Syncthing 同步的資料夾。 iPhone → obsidian-livesync(CouchDB)。 因為 iOS 的 Obsidian 不能開外部資料夾 (沙盒限制),所以「Syncthing 同步到某資料夾」這招在 iOS 是死路。LiveSync 改成在 App 內部、透過資料庫同步。 最重要的一條心得: 唯一長得像 Obsidian、用起來像 Obsidian 的,就是 Obsidian 本人。 每一個「用瀏覽器看你的 vault」的捷徑,付出的代價都比省下的多。 目標與...

Self-hosting multi-device Obsidian sync (Windows + Raspberry Pi + Android + iPhone): what worked, what didn't, and why

Self-hosting multi-device Obsidian sync (Windows + Raspberry Pi + Android + iPhone): what worked, what didn't, and why A point-in-time field report (2026-06) on getting one Obsidian vault synced, self-hosted and free, across a Windows desktop, an always-on Raspberry Pi, three Android phones and an iPhone. This is not another happy-path tutorial — the official docs for each tool are excellent. It's the part that's usually missing: the dead ends, the why-not, and the platform-specific traps (especially on ARM Raspberry Pi and on iOS). If you're about to do the same thing, this should save you a few evenings. Author: fifthadj. Use freely. No warranty — tools move fast; treat this as a snapshot, not a maintained guide. TL;DR — the setup that actually worked Device Sync method Windows desktop Syncthing (also doubles as the iOS "bridge", see below) Raspberry Pi 4 (always-on Linux hub) Syncthing hub + CouchDB (for iOS) Android phones (×3...