vatt'ghern jaskier's ballads

2026.05.17 —— 今日 10 則

TODAY'S THREAD C++26 std::simd 的反思、Magic Pocket 三層 compaction、Zig 0.16 的 std.Io——三個獨立的設計都在重新討論「介面層」應該擔多少責任。

10 items systems · 4 ai · 2 storage · 2 infra · 1 industry · 1
0 / 10 read
#09

Apple Silicon 跑本地 LLM,每百萬 token 為何仍貴過 OpenRouter

M5 Max MacBook Pro(64 GB、$4,299)跑 Gemma 4 31B 在 10–40 tokens/s 下換算成本是雲端 OpenRouter 同款模型約三倍,硬體攤提主導費用結構。雲端 60–70 tokens/s 的速度差更進一步擴大成本差距,本地推理的真正用途在隱私與延遲,而非省錢。

read source → AI

#10

GPT-5.5 漲價後實際成本只升 49–92%——OpenRouter 用切換 cohort 還原真實帳單

OpenRouter 對比 5.4 切換到 5.5 的用戶實測:input 從 $2.50 漲到 $5.00、output 從 $15 漲到 $30,但 10K 以上的長 prompt 因為 completion 縮短 19–34%,總成本只多 49%。短 prompt 沒有這個抵銷效應,成本接近翻倍。

read source → LLM

#01

C++26 出貨了一個沒人想要的 SIMD 庫——std::simd 的可用性質疑

P1928 在 C++26 標準化的 std::simd 被批評編譯時間慢 10 倍、執行效能輸給編譯器自動向量化 2.4 倍,且預設使用 128 位 SSE 寬度而非機器實際能力。更核心的問題是 cross-lane shuffle/permute——「真實 SIMD 程式碼九成的需求」——在 std::simd 裡完全沒有覆蓋。

read source → deep ↗ C++

#04

Zig 0.16 的 std.Io——讓非同步成為庫設計選擇,而非語言內建

Zig 0.16 引入 std.Io 抽象介面,分離 I/O 後端與函式庫程式碼;同一份 code 可以無改動地跑在 std.Io.Threaded(thread pool)或 zio(stackful coroutine + io_uring)後端上。10,000 個並行 sleep 任務在 thread 模式 20s 完成、coroutine 模式 10.6s,且 coroutine 模式可擴展到 5 萬以上。

read source → deep ↗ Zig

#05

Bun 從 Zig 改寫到 Rust——6755 個 commit 在六天內合入、僅有 AI 審查

劉家才分析:Bun 在被收購後啟動 Zig → Rust 大重寫,理由是 use-after-free 與 double-free 頻繁,但 6755 個 commit 在六天內合入、沒有人類 reviewer 通讀的事實本身就是長期風險。短期 Rust 借編譯器把關不會出大事,長期當 production bug 出現在「沒有人讀過的程式碼裡」才見真章。

read source → Rust

#07

GitHub SSH 預設啟用 post-quantum 金鑰交換——sntrup761x25519-sha512 上線

GitHub.com 9 月 17 日把 sntrup761x25519-sha512 設為 SSH 的預設 KEX,OpenSSH 9.0 以上的客戶端會自動選用,舊客戶端 fallback 到傳統演算法。混合設計(Streamlined NTRU Prime + X25519)確保即使後量子演算法將來被破,安全性仍至少維持在 X25519 等級;US 區域因 FIPS 限制暫不啟用。

read source → SSH

#08

Slack 把 Airflow 對 EMR 的 SSH 通道改成 REST 閘道 Quarry

700 多個資料管線 job 過去靠 Airflow worker 對 EMR master 直接 SSH 執行 spark-submit,Slack 改用內部 REST 閘道 Quarry 走 YARN,順便用 YARN Distributed Shell 跑 shell/AWS CLI 工作量。SSH 金鑰分發、稽核斷裂、子帳號隔離三個資安債一次清掉,三季完成、零停機。

read source → Airflow

#02

Dropbox Magic Pocket 把 compaction 拆成 L1/L2/L3 三層——稀疏 volume 的快速回收

Magic Pocket 過去只有 L1 維穩式 compaction,遇到「整批 volume 同時稀疏化」的事件無法快速排空。新增 L2(動態規劃打包)與 L3(連續排空管線)後,整體 compaction overhead 在生產環境降低 30–50%。L2 在測試集上比 L1 快 2–3 倍,L3 專門對付不到 5% 使用率的最稀疏 volume。

read source → deep ↗ storage

#06

Stripe 的 Data Movement Platform——文件資料庫的零停機 schema 遷移

Stripe 工程部落格揭露其 document database 達到 99.999% uptime 的關鍵:Data Movement Platform 支援 dual-write、shadow read、線上 schema 變更等模式,把資料層搬遷與業務凍結解綁。對於每年都要重構資料模型的支付系統,這個平台是 SLO 的底層支柱。

read source → database

#03

NIST 收窄 NVD 的 CVE 補完範圍——容器掃描與合規工具該重新評估

Docker 部落格整理 NIST 4 月 15 日公告的影響:NVD 不再對所有 CVE 補完 CVSS 分數與 CPE 映射,容器漏洞掃描器若把缺值當「無風險」會嚴重低估。Compliance 工具仰賴 CVSS 過濾規則的客戶需要重新校準閾值,或改採其他資料源(OSV、GitHub Advisory Database)做 cross-check。

read source → security

today's deep reads

std::simd、Google Highway、ISPC 之間怎麼選——C++26 SIMD 庫的真正可用性對照

表達力、編譯時間、執行期效能、可攜性四個維度對齊,看 std::simd 適合哪種專案、哪些情境需要回去用 Highway 或 ISPC。

Magic Pocket 的三層 compaction——L1 維穩、L2 動態規劃打包、L3 串流排空

三條 pipeline 各自針對「volume 稀疏化的不同速度」設計,組合起來才能在 EB 級 immutable blob store 維持穩定的 storage overhead。

std.Io,從零講起——Zig 0.16 怎麼把非同步從語言降級成庫的選擇

為什麼 Zig 0.15 走過的 async/await 路被拋棄?std.Io 介面如何讓同一份高並發程式碼在 thread 與 coroutine 後端之間直接互換?