2026.06.03 —— 今日 10 則
TODAY'S THREAD 三篇 deep 從三條工程角度切「LLM 跟系統語言都在重畫底層的合約」:LinkedIn 把整套 search 棧改成 LLM-centric,從 query understanding 到 ranking 一路換掉並把 throughput 推到 22,000 items/sec/GPU;另一邊有人把 DeepSeek-V4-Flash bring-up 到 AMD MI300X,記下 FP8 dialect、AITER sparse MLA、HIP graph capture 三個壞掉的點;再回到語言層,Oxide 把 iddqd 裡 intrusive linked list 的 pin、provenance、aliasing 三條正交不變式拆開展示,連 &mut 都不能直接用。其餘七則沿底層走——agent 找出的 HTTP/2 漏洞、physical AI 的 world model、稅務 jurisdiction、embedding pipeline、HTTP header fingerprint、KDE 的 X11 收尾、GCC 16 的 BPF 後端,工具換新的同時,下面那層的取捨也在被重排。
LinkedIn 把整套 search 棧重新拆過——從 retrieval 到 rerank 都換成 LLM-centric
LinkedIn 把整套 search 棧重新拆過——把 BM25 加 heuristics 的傳統 retrieval/ranker 換成 LLM 為核心的設計,從 query understanding、retrieval、rerank 一路改造,更快、更準、也更個人化。對在自家搜尋上盤算「LLM 怎麼真的上線」的隊伍,這篇講了把純檢索系統與生成模型怎麼接合的具體選擇——以及不應為了 LLM 而 LLM 的工程克制。
把 DeepSeek-V4-Flash bring-up 到 AMD MI300X——一份完整的 ROCm 案場日誌
作者把 DeepSeek-V4-Flash 在 AMD MI300X 上跑起來,記下 kernel 選擇、記憶體佈局、量化決策與 token/s 數字。對只能在 H100 庫存外另尋 inference 平台的隊伍,這是一份具體可重現的 bring-up 紀錄——也是判斷 ROCm 軟體棧到底還缺哪幾塊的最新案場資料。
NVIDIA Cosmos 3:把 world model 推到 physical AI 主舞台
NVIDIA 釋出 Cosmos 3,一個面向 physical AI(機器人、自動駕駛、模擬人形)的 open-world foundation model——讓 agent 在動作前先在 world model 裡想一遍後果。對賭 robotics 之外還想做 sim-to-real 的隊伍,這份模型把「動作前的 mental rollout」拉到通用 foundation model 的層級,重新定義 perception 與 action 之間的中介。
Codex 在 HTTP/2 函式庫挖出放大攻擊漏洞——「agent 真的找得到新東西」的存在證明
OpenAI 的 coding agent Codex 在一個熱門 HTTP/2 函式庫裡撈出一個放大攻擊漏洞——agent 的 fuzzing 加上輔助推理找到了維護者多年沒注意的角落。對研發 agent 工具、或維護 HTTP/2 stack 的隊伍,這是「agent 真的能找出新東西」的具體存在證明,也順帶把 HTTP/2 frame 解析在記憶體與時間維度上的失衡點攤開來。
iddqd——Oxide 把 unsafe Rust 最尖角的部分照給你看
Oxide 把他們 iddqd crate 裡最棘手的 unsafe Rust 模式拿出來解析——intrusive linked list 的 pinning、provenance、aliasing 規則同時被踩到。對寫 unsafe Rust 而又非真的需要 unsafe 的工程師,這是一個照妖鏡:你大概以為的 invariant,標準借用模型可能 already 不允許。
BPF support in GCC 16——對 clang 獨佔的 BPF 編譯這條線終於有第二條軌道
LWN 詳寫了 GCC 16 的 BPF backend 進度——對 clang 一直獨佔的 BPF 編譯這條線,GCC 開始能跑大部分 production BPF 程式。對在 distro(特別是 Debian、Ubuntu)想擺脫 clang 工具鏈依賴的 BPF 玩家,這是值得追蹤的另一條軌道,文章還比較了兩條 toolchain 在 instruction selection 與 relocations 上的具體差異。
KDE Plasma 預告:下一個大版是最後一個支援 X11 session
KDE 預告下一個 Plasma 大版會是最後一個支援 X11 session 的版本——之後只剩 Wayland。對仍把 X11-only 工具(某些遠端桌面、特定 GPU stack、舊版測試工具)綁在 KDE Linux 工作站的人,這份 roadmap 給出明確時程,也說明還有哪些 Wayland gap(部分 input event、screencasting、舊 X 應用程式)會在收口前被補完。
用 HTTP header 順序辨識瀏覽器——User-Agent 偽造擋不住的指紋面
作者把 HTTP request header 的順序當成 browser fingerprint——即便 User-Agent 被改寫,Chromium、Firefox、curl、各家 bot 的 header 順序仍能拿來區分。對在 anti-bot 或反追蹤兩端的人,這篇把「header 順序」這條相對冷僻的訊號從原理講到怎麼穩定觀察,也順帶提醒 HTTP/2 與 HTTP/3 的 binary framing 對該訊號的影響面。
Stripe 把 Tax 的「jurisdiction resolution」重寫——更快、更便宜、處理重疊稅務區
Stripe 把 Tax 服務裡最噁心的一塊——「這筆交易到底屬於哪個課稅 jurisdiction」——重寫了一次,算得比舊版快、便宜,還能正確處理重疊的稅務區。對任何要做 geo-aware billing 或合規系統的人,這份 writeup 把「地址解析 → 政治地圖 → 稅率」的資料結構與查詢路徑攤開來,是一個值得抄走的工程模板。
Microsoft 開源 OmniVec——把 embedding pipeline 升格成 platform
微軟 Cosmos DB 團隊把他們新的 embedding pipeline 開源成 OmniVec:把 source data 與 vector store 之間的同步、broken-state 重建、多 source/sink 註冊收成一個 platform,而不是各自 ad-hoc 接管。對自家還在用「Lambda 加 cron 重算 embedding」這條黏膠路線的隊伍,這是把 embedding 升格成 first-class data product 的一個現成參考實作。