2026.06.03 —— 今日 10 則

TODAY'S THREAD 三篇 deep 從三條工程角度切「LLM 跟系統語言都在重畫底層的合約」：LinkedIn 把整套 search 棧改成 LLM-centric，從 query understanding 到 ranking 一路換掉並把 throughput 推到 22,000 items/sec/GPU；另一邊有人把 DeepSeek-V4-Flash bring-up 到 AMD MI300X，記下 FP8 dialect、AITER sparse MLA、HIP graph capture 三個壞掉的點；再回到語言層，Oxide 把 iddqd 裡 intrusive linked list 的 pin、provenance、aliasing 三條正交不變式拆開展示，連 &mut 都不能直接用。其餘七則沿底層走——agent 找出的 HTTP/2 漏洞、physical AI 的 world model、稅務 jurisdiction、embedding pipeline、HTTP header fingerprint、KDE 的 X11 收尾、GCC 16 的 BPF 後端，工具換新的同時，下面那層的取捨也在被重排。

0 / 10 read

#01

LinkedIn 把整套 search 棧重新拆過——從 retrieval 到 rerank 都換成 LLM-centric

LinkedIn 把整套 search 棧重新拆過——把 BM25 加 heuristics 的傳統 retrieval/ranker 換成 LLM 為核心的設計，從 query understanding、retrieval、rerank 一路改造，更快、更準、也更個人化。對在自家搜尋上盤算「LLM 怎麼真的上線」的隊伍，這篇講了把純檢索系統與生成模型怎麼接合的具體選擇——以及不應為了 LLM 而 LLM 的工程克制。

read source → deep read llm-search

#02

把 DeepSeek-V4-Flash bring-up 到 AMD MI300X——一份完整的 ROCm 案場日誌

作者把 DeepSeek-V4-Flash 在 AMD MI300X 上跑起來，記下 kernel 選擇、記憶體佈局、量化決策與 token/s 數字。對只能在 H100 庫存外另尋 inference 平台的隊伍，這是一份具體可重現的 bring-up 紀錄——也是判斷 ROCm 軟體棧到底還缺哪幾塊的最新案場資料。

read source → deep read amd-gpu

#05

NVIDIA Cosmos 3：把 world model 推到 physical AI 主舞台

NVIDIA 釋出 Cosmos 3，一個面向 physical AI（機器人、自動駕駛、模擬人形）的 open-world foundation model——讓 agent 在動作前先在 world model 裡想一遍後果。對賭 robotics 之外還想做 sim-to-real 的隊伍，這份模型把「動作前的 mental rollout」拉到通用 foundation model 的層級，重新定義 perception 與 action 之間的中介。

read source → world-models

#03

Codex 在 HTTP/2 函式庫挖出放大攻擊漏洞——「agent 真的找得到新東西」的存在證明

OpenAI 的 coding agent Codex 在一個熱門 HTTP/2 函式庫裡撈出一個放大攻擊漏洞——agent 的 fuzzing 加上輔助推理找到了維護者多年沒注意的角落。對研發 agent 工具、或維護 HTTP/2 stack 的隊伍，這是「agent 真的能找出新東西」的具體存在證明，也順帶把 HTTP/2 frame 解析在記憶體與時間維度上的失衡點攤開來。

read source → http2

#04

iddqd——Oxide 把 unsafe Rust 最尖角的部分照給你看

Oxide 把他們 iddqd crate 裡最棘手的 unsafe Rust 模式拿出來解析——intrusive linked list 的 pinning、provenance、aliasing 規則同時被踩到。對寫 unsafe Rust 而又非真的需要 unsafe 的工程師，這是一個照妖鏡：你大概以為的 invariant，標準借用模型可能 already 不允許。

read source → deep read unsafe-rust

#10

BPF support in GCC 16——對 clang 獨佔的 BPF 編譯這條線終於有第二條軌道

LWN 詳寫了 GCC 16 的 BPF backend 進度——對 clang 一直獨佔的 BPF 編譯這條線，GCC 開始能跑大部分 production BPF 程式。對在 distro（特別是 Debian、Ubuntu）想擺脫 clang 工具鏈依賴的 BPF 玩家，這是值得追蹤的另一條軌道，文章還比較了兩條 toolchain 在 instruction selection 與 relocations 上的具體差異。

read source → bpf

#09

KDE Plasma 預告：下一個大版是最後一個支援 X11 session

KDE 預告下一個 Plasma 大版會是最後一個支援 X11 session 的版本——之後只剩 Wayland。對仍把 X11-only 工具（某些遠端桌面、特定 GPU stack、舊版測試工具）綁在 KDE Linux 工作站的人，這份 roadmap 給出明確時程，也說明還有哪些 Wayland gap（部分 input event、screencasting、舊 X 應用程式）會在收口前被補完。

read source → wayland

#08

用 HTTP header 順序辨識瀏覽器——User-Agent 偽造擋不住的指紋面

作者把 HTTP request header 的順序當成 browser fingerprint——即便 User-Agent 被改寫，Chromium、Firefox、curl、各家 bot 的 header 順序仍能拿來區分。對在 anti-bot 或反追蹤兩端的人，這篇把「header 順序」這條相對冷僻的訊號從原理講到怎麼穩定觀察，也順帶提醒 HTTP/2 與 HTTP/3 的 binary framing 對該訊號的影響面。

read source → fingerprinting

#06

Stripe 把 Tax 的「jurisdiction resolution」重寫——更快、更便宜、處理重疊稅務區

Stripe 把 Tax 服務裡最噁心的一塊——「這筆交易到底屬於哪個課稅 jurisdiction」——重寫了一次，算得比舊版快、便宜，還能正確處理重疊的稅務區。對任何要做 geo-aware billing 或合規系統的人，這份 writeup 把「地址解析 → 政治地圖 → 稅率」的資料結構與查詢路徑攤開來，是一個值得抄走的工程模板。

read source → tax-engine

#07

Microsoft 開源 OmniVec——把 embedding pipeline 升格成 platform

微軟 Cosmos DB 團隊把他們新的 embedding pipeline 開源成 OmniVec：把 source data 與 vector store 之間的同步、broken-state 重建、多 source/sink 註冊收成一個 platform，而不是各自 ad-hoc 接管。對自家還在用「Lambda 加 cron 重算 embedding」這條黏膠路線的隊伍，這是把 embedding 升格成 first-class data product 的一個現成參考實作。

read source → embeddings

today's deep reads

deep · 01 LinkedIn 把 search 棧改成 LLM-centric——重寫的不是 ranker，是「query 怎麼被理解」這層 deep · 02 DeepSeek-V4-Flash 在 AMD MI300X 上 bring-up——一份 ROCm 案場的時間軸 deep · 04 iddqd——pin、provenance、aliasing 三條正交不變式同時掉在一個 &mut Node 上的 Rust 體操