vatt'ghern jaskier's ballads

2026.06.12 —— 今日 10 則

TODAY'S THREAD 今天有兩條線。一條是「把信任變成能驗證的東西」——AWS 用約 33 萬行證明替 EC2 的虛擬機隔離背書、有人做 ModSleuth 把 LLM 的隱形依賴挖成可稽核的圖,反面則是 AMD 更新器因為不驗簽章被 MITM 成 RCE、AUR 又傳出供應鏈攻擊。另一條是「把運算挪到更省力的位置」——Discord 把語音搬上邊緣、local-first 直接把負載移回使用者裝置,連 aMule 都靠把磁碟 I/O 移出主執行緒換來數量級提速。

10 items ai · 2 systems · 3 infra · 3 web · 1 backend · 1
0 / 10 read
#08

我們的模型建在誰之上——稽核 LLM 的隱形依賴

一篇論文指出現代 LLM 訓練越來越依賴其他模型——拿來生成資料、過濾語料、當評審或做開發決策——而這些依賴是遞迴又散落的,早已超出人能追的範圍。作者做了 ModSleuth:一個 agentic 系統,能從公開產物遞迴重建模型的依賴圖、且每條依賴都有來源佐證。他們在四個 LLM 釋出上挖出 1,060 條可驗證依賴,揭露多跳的授權義務以及訓練與評估資料的耦合。

read source → deep read llm

#09

用 manifold power iteration 重新設計 MoE router

一篇 arXiv 論文替混合專家模型的 router 提出新設計:用 manifold power iteration,讓 router 的每一列收斂到對應 expert 矩陣的主奇異方向。作者的論點是這個方向最能濃縮一個矩陣的資訊,而現行 router 缺的正是「該往哪裡濃縮」的設計準則。他們在 1B 到 11B 參數規模的預訓練上驗證這套 Power-then-Retract 做法確實讓 MoE 更有效。

read source → mixture-of-experts

#03

AMD 不肯修的那個更新器 RCE

一位研究者在逆向 AMD AutoUpdate 時發現它用 HTTP 下載更新、且執行前完全不驗簽章,任何能做中間人的攻擊者就能換掉執行檔達成 RCE。AMD 起初以「需要 MITM、又是選用工具」為由判定 out of scope、拒付賞金,卻又要求把文章下架,前後矛盾。整段揭露歷時 124 天,最後的修補也只加了 CRC-32 校驗而非真正的密碼學簽章。

read source → deep read security

#05

Rust 裡 main 之前的人生

這篇把 Rust 程式在 main 之前到底跑了什麼攤開來看:從建在 libc 之上的 C runtime,到 linker 把建構子位址放進 .init_array 區段、再依優先序逐一呼叫。作者也介紹用 ctor crate 以 priority 屬性抽掉各平台 linker section 的差異,並提醒 pre-main 建構子不能安全 panic、Miri 也支援不全。對寫過 C runtime、或想在 main 前掛初始化邏輯的人,這是把底層機制講透的一篇。

read source → rust

#06

aMule 3.0.0——把磁碟 I/O 移出主執行緒

aMule 3.0.0 把磁碟 I/O 從主執行緒移走、並改寫相關演算法,官方 changelog 宣稱 P2P 傳輸在某些情境下提速 100 到 380 倍。對一個歷史悠久的 eMule 系開源用戶端來說,瓶頸長年卡在主執行緒被同步磁碟操作堵住。對在維護老 C++ 桌面程式、想把 I/O 阻塞挪出熱路徑的人,這是一個用執行緒拆分換來數量級提速的案例。

read source → performance

#01

把虛擬機隔離證明成數學定理——EC2 的形式化驗證引擎

AWS 把 EC2 的虛擬機隔離邏輯抽成一個最小的 Nitro Isolation Engine,並用 Isabelle/HOL 寫出約 33 萬行機器可檢的證明,宣稱是第一個部署在商用雲的形式化驗證 hypervisor。做法是把 Rust 限縮成可推理的 μRust 子集,再用 separation logic 與 noninterference 證明機密性、完整性與記憶體安全。對在多租戶環境上跑工作負載、或好奇形式化方法怎麼從 seL4 走進量產的人,這是把隔離保證從測試升級成證明的一次轉折。

read source → deep read formal-verification

#04

我們怎麼把 Discord 語音搬到邊緣

Discord 把語音服務從集中式機房搬到邊緣節點,讓使用者的語音流量在更靠近自己的地方就近接入、再回傳骨幹,目標是壓低延遲與改善路由韌性。文章講他們怎麼處理邊緣節點的部署、故障切換與媒體流的轉送。對在跑即時音視訊、被尾端延遲與跨區抖動困擾的團隊,這是一份把語音基礎設施往邊緣推的實作參考。

read source → edge-computing

#07

AUR 傳出供應鏈攻擊

Arch User Repository 傳出供應鏈攻擊:多個套件帳號遭入侵、被植入惡意 commit,維護者正動手重設並封鎖相關帳號、清掉惡意提交。AUR 的信任模型本來就是「使用者自負風險」,這次事件再次提醒從 AUR 安裝等於信任上游維護者的帳號安全。對日常用 AUR helper 一鍵安裝的人,這是一個該重新檢視來源與 PKGBUILD 的時刻。

read source → supply-chain

#10

Local-First 軟體更容易擴展

作者用自家文法檢查器 Harper 的經驗論證 local-first 軟體更容易擴展:因為運算發生在使用者裝置上,伺服器幾乎不承擔負載。Hacker News 帶來一波流量時,他甚至是事後才發現的,因為「沒有伺服器要撐」就沒有任何基礎設施壓力。對照同類的 LanguageTool 得隨流量加雲端機器,local-first 把擴展問題從根本上移走了。

read source → local-first

#02

軟體測試的新時代

antirez 主張 LLM 對軟體測試是少數「純加分」的應用——不像 AI 生成程式碼會拿品質換速度,把 LLM 當 QA 工程師反而開出更強的自動化路線。具體做法是用 markdown 描述讓 agent 讀懂新 commit 牽動哪些區域,再針對可能的回歸做有目標的手動式測試,他拿 DwarfStar 推論引擎與 Redis 的 array 功能當例子。對覺得「覆蓋率高不等於覆蓋了所有狀態」的人,這篇把測試的盲點與一條補法講得很清楚。

read source → software-testing

today's deep reads

deep · 01 把虛擬機隔離證明成數學定理——EC2 的形式化驗證引擎 deep · 02 AMD 不肯修的那個更新器 RCE——一場 124 天的揭露 deep · 03 我們的模型到底建在誰之上——把 LLM 的隱形依賴挖出來