vatt'ghern jaskier's ballads

2026.06.15 —— 今日 10 則

TODAY'S THREAD 今天大半的線索都繞著同一件事——你以為省下來的工,其實只是換了地方。Postgres 的 DELETE 把回收推給 autovacuum、Elevator 把執行期省下的代價換成爆量的 .text、私有推論把信任從「看不到」換成「證明跑了哪段碼」;另一頭則是幾個把帳算清楚的決定:npm 預設關掉 install script、Graviton5 拿更大的快取換頻寬、ScaleAcross 把一次訓練拆到多個機房。

10 items ai · 2 systems · 2 infra · 2 web · 2 backend · 2
0 / 10 read
#02

私有推論還不夠私有——Siri 新架構的威脅模型缺口

密碼學家 Matthew Green 撰文質疑:新版 Siri 主打的「私有推論」,並沒有給到大多數人以為的隱私。他的重點在威脅模型——一個能讀取你整台裝置脈絡的助理,就算運算發生在可驗證的環境裡,attestation 證明的也只是「跑的是哪段程式碼」,而不是「這套設計不會外洩」。對任何要把 on-device LLM 接上雲端、又向用戶承諾隱私的人,這篇把「資料有被保護」與「沒有人看得到」之間的差距講得很清楚。

read source → deep read private-inference

#09

Anthropic 聲明:美國政府要求暫停 Fable 5 與 Mythos 5 存取

Anthropic 發出聲明,表示美國政府要求暫停對其 Fable 5 與 Mythos 5 兩個模型的存取。撇開政策層面不談,對工程端來說這是一則很實際的供應風險提醒——當產品把某個前沿模型當成依賴,提供方的存取可能因為外部指令而中斷。對正在把單一供應商模型接進生產路徑的團隊,這值得重新想想 fallback 與多供應商的安排。

read source → ai-policy

#03

把 x86-64 靜態翻成 aarch64——Elevator 的程式碼膨脹之謎

一篇 arXiv 論文提出 Elevator——一個把 x86-64 機器碼靜態(離線)翻成 AArch64 的組語級轉譯器,不靠啟發式。耐人尋味的是,它翻出來的 .text 在 SPECint 2006 上比原生編譯的 AArch64 大上 47.5 到 62.5 倍,效能卻仍勝過 QEMU 的動態翻譯。這篇要追問的就是:忠實地逐指令翻譯,到底得多吐出多少程式碼來保住 x86 語意,而靜態翻譯又為什麼能在膨脹成這樣的情況下還跑得比較快。

read source → deep read binary-translation

#07

把 Datalog 拆開來看——一篇論文的逐層拆解

rntz 把自己的論文整理成一篇「拆解 Datalog」——把這個邏輯語言一層層拆開、再組回去,從語意到求值策略講起。作者直言 Datalog「影響力超過它的知名度」,那些想法至今仍在慢慢被主流吸收。對好奇宣告式查詢底層、或想把 Datalog 引擎接進自己工具的人,這是一份難得從頭講起的整理。

read source → datalog

#05

AWS Graviton5 上線——L3 五倍、PCIe Gen6、DDR5-8800

AWS 推出 Graviton5 系列——官方數字是效能比上一代提升 25 到 35%,L3 快取放大五倍,並支援 PCIe Gen6 與 DDR5-8800,價格約上漲 9%。對在 ARM 實例上跑服務、或正在做 instance 選型的人,這代的記憶體頻寬與快取改動會直接影響哪些 workload 值得搬過去。

read source → arm

#08

ScaleAcross——跨資料中心的地理分散 AI 訓練架構

一篇系統論文 ScaleAcross 設計了一套跨資料中心的基礎設施,專門給地理上分散的 AI 訓練用——當單一機房塞不下一次訓練、或算力散在不同地區時,怎麼處理跨區頻寬、排程與故障域。對在規劃大規模訓練、卻被單一資料中心容量卡住的團隊,這篇把「把訓練拆到多個機房」要面對的工程取捨攤開來談。

read source → distributed-training

#06

Chrome 拔掉 Manifest V2 的最後 workaround

Chromium 150 到 151 把最後幾個還能讓 Manifest V2 擴充苟活的 flag 也拿掉了——MV2 退場至此沒有迴避空間。對還在維護 MV2 擴充的開發者,這代表「再撐一下」的選項正式消失,得把功能搬到 MV3 的 service worker 與宣告式 API 上。

read source → browser-extensions

#10

Linux 上的 Firefox 要支援 Vulkan 影片解碼

Linux 上的 Firefox(153)合併了透過 Vulkan 做硬體影片解碼的支援,要取代過去吃 CPU 的解碼路徑。對 Linux 桌面用戶,這直接關係到看影片時的耗電與發熱;對前端與多媒體開發者,則多了一條在 Linux 上比較可靠的硬解路徑。

read source → firefox

#01

Postgres 唯一能規模化的 DELETE 是 DROP TABLE

PlanetScale 的論點很直接:在 Postgres 裡 DELETE 並不會把空間還回來——MVCC 把刪掉的列變成 dead tuple,要等 autovacuum 之後再來掃,索引也原封不動,這筆刪除還會以寫入的形式往下游複製。換句話說,大批 DELETE 是「製造工作」而不是「完成工作」。真正能規模化的做法是把資料切成 partition,讓刪除變成偶爾一次的 DROP TABLE——直接砍檔案、掃 buffer cache,而不是逐列標記。

read source → deep read postgres

#04

npm v12 預設關閉 post-install script

npm v12 打算把 post-install script 預設關掉——這類在安裝時自動執行的腳本,長年是供應鏈攻擊最常見的入口。改成預設不跑,等於把「裝個套件就被執行任意程式碼」這條路堵上,和其他套件管理器近年的做法一致。對任何 CI 會大量 npm install 的團隊,這個預設值的翻轉值得提早盤點哪些套件真的依賴 install hook。

read source → supply-chain

today's deep reads

deep · 01 Postgres 唯一能規模化的 DELETE 是 DROP TABLE——dead tuple 與 partition drop deep · 02 私有推論還不夠私有——Siri 新架構的威脅模型缺口 deep · 03 把 x86-64 靜態翻成 aarch64——Elevator 的程式碼膨脹之謎