vatt'ghern jaskier's ballads

2026.06.04 —— 今日 10 則

TODAY'S THREAD 今天有三條新聞都在同一個地方使力——把「預設可信」收緊成「必須驗證」:Let's Encrypt 用 Merkle Tree Certificate 把後量子簽章塞回比現況更小的握手、Cloudflare 拿 RFC 4271 早就寫好的 first-AS 檢查補 RPKI 補不到的 BGP 路徑偽造、一個研究者把 VSCode webview 能偽造鍵盤事件的縫隙串成一鍵偷走 github.dev token。另一邊則是用架構與型別把成本與正確性換回來——Gemma 4 拿掉視覺 encoder、JetBrains Mellum2 用 12B/2.5B-active 的 MoE 做帶 reasoning 的 coding、Elixir 把 set-theoretic 型別系統正式變成語言預設。

10 items ai · 3 systems · 2 infra · 2 web · 1 backend · 2
0 / 10 read
#05

Gemma 4 12B:拿掉視覺 encoder,把影像與音訊直接餵進 backbone

Google 釋出 Gemma 4 12B,一個 dense 多模態模型,最大特徵是 encoder-free 架構——影像與音訊不再經過獨立的視覺 encoder,而是直接餵進 LLM backbone,同時搭 Google AI Edge 跑在筆電上做本地 agentic workflow。對想把多模態推理塞進端側、又不想扛一整套 vision tower 的人,這條「encoder-free + 端側」的路線值得對照自家的部署假設。

read source → gemma

#07

JetBrains Mellum2:12B 總參數、2.5B 啟用的 MoE,帶 <think> 的 coding 模型

JetBrains 開源 Mellum2-12B-A2.5B-Thinking,一個專為 coding 與 agentic 工作流設計的 MoE:64 個專家每 token 啟用 8 個、總參 12B、啟用 2.5B、131K context,並用 <think> 區塊在回答前顯式推理,訓練走 SFT 加 RLVR。對在 IDE 內嵌 inference 或自建 coding agent 的隊伍,這份模型示範了「小啟用參數 + 顯式 reasoning」如何在 LiveCodeBench v6 拿到 69.9,且以 Apache 2.0 釋出可直接落地。

read source → mellum

#08

「Language Models Need Sleep」——把 in-context 記憶睡成長期參數的兩階段機制

一篇 arXiv 論文提出 Sleep paradigm,想補上 LLM 不會持續學習的缺口:先用 on-policy distillation 把小網路的記憶「鞏固」進大網路(knowledge seeding),再進「dreaming」階段讓模型自行生成合成課程做 RL 自我精進。對在追 continual learning 與避免災難性遺忘的人,這篇把「睡眠鞏固」這個生物學比喻落成可量測的兩階段流程,long-horizon 與 few-shot 任務上都報了正向結果。

read source → continual-learning

#03

Elixir v1.20:set-theoretic 漸進式型別正式變成語言預設

Elixir 1.20 把醞釀自 2022 年的 set-theoretic 型別系統推成預設——不需要任何型別註記就對全程式做推論與檢查,用 union/intersection/negation 描述型別,並以 dynamic() 取代傳統 gradual typing 的 any(),只在供需型別完全 disjoint 時才報錯。對寫 Elixir 的人,這代表 guard、pattern match、case 都開始能在編譯期抓出「保證 runtime 會炸」的 verified bug,而且作者強調 false-positive 率被壓得很低。

read source → deep read gradual-typing

#09

Kotlin 2.4.0:穩定 context parameters,Wasm Component Model 進場

Kotlin 2.4.0 是一個以穩定化為主軸的版本——context parameters、explicit backing fields、UUID API 轉正,Kotlin/Wasm 預設開啟 incremental compilation 並支援 WebAssembly Component Model,Kotlin/Native 換上預設的 concurrent mark-sweep GC、還能把 Swift package 當依賴。對跨平台 Kotlin 的隊伍,這版把幾個長期 experimental 的語言特性收口,也把 JVM 對到 Java 26、Gradle 對到 9.5。

read source → kotlin

#01

Let's Encrypt 的後量子路線:不是 ML-DSA,是 Merkle Tree Certificate

Let's Encrypt 公布後量子憑證策略,刻意不直接用 ML-DSA 逐張簽——因為單張 ML-DSA-44 簽章就有 2,420 bytes,整個握手會膨脹超過 10 KB,在真實網路上會讓相當比例的 TLS 連線直接失敗。它選的是 Merkle Tree Certificate:把一批憑證收進一棵 Merkle tree、用一個後量子簽章覆蓋整批,常見情況的握手反而比今天還小,且 Certificate Transparency 變成內建性質。Staging 預計 2026 年底、production 2027。

read source → deep read post-quantum

#04

Cloudflare 量了 first-AS 檢查——半數 Tier 1 還擋不住路徑偽造

Cloudflare 用測試 prefix 量了各家 Tier 1 對 BGP first-AS 的執行情況:14 家裡只有 7 家(Cogent、Arelion、GTT、PCCW、Orange、Tata、AT&T)會丟掉 AS_PATH 首段對不上 peer ASN 的偽造公告,另外 7 家照收照傳。first-AS 是 RFC 4271 本就寫好的檢查,補的正是 RPKI/ASPA 補不到的縫——當攻擊者把 AS_PATH 整段抹掉只留合法 origin,ASPA 看不到 valley,但 first-AS 看得出「宣告者沒把自己放進去」。Junos 預設不開、Cisco/Arista/Huawei 預設開。

read source → bgp-security

#10

WebMCP 與 Chrome DevTools for agents——把 agent 能力寫進 web 平台標準

Google I/O 2026 把 agent 推向 web 平台層:WebMCP 想讓網站用標準方式對 agent 暴露可呼叫的工具與上下文,而非每家各自做 scraping,搭配 Chrome 端為 agent 設計的 DevTools 與 CLI 工具鏈。對做前端與 web 平台的人,這代表「網站要不要、以及怎麼對 agent 開放」正從各家黑魔法變成需要追的標準討論,影響面從 SEO 一路延伸到權限模型。

read source → webmcp

#02

一鍵偷走 github.dev 的 GitHub token——VSCode webview 偽造鍵盤事件串起來的攻擊鏈

一份 full disclosure 把 github.dev 上的 1-click token 竊取從頭演了一遍:webview 裡的不可信腳本能對 VSCode 派發合成 keydown 事件,於是 Ctrl+Shift+A 接受擴充推薦、本地工作區擴充跳過 publisher 信任檢查、自訂 keybinding 帶 skipPublisherTrust 達成任意程式執行,最後讀走 localStorage 裡那張對所有私有 repo 都有效的 OAuth token。研究者 6/2 通報、微軟 6/3 上了 stopgap——根因是 VSCode 把 webview 來的 KeyboardEvent 當成真實使用者輸入。

read source → deep read vscode-security

#06

Discord 把預設指標從 50 砍到 15——用 PCA 與 false discovery 重挑信號

Discord 重新檢視 A/B 實驗的預設指標集,發現「指標越多越好」其實在扣分——100 個指標配 5% 顯著門檻,光靠隨機就約 5 個誤報,上 Benjamini-Hochberg 校正壓誤報又犧牲 recall。他們改走減法:用相關性與 PCA(PC1 就解釋約 63% 變異)找出冗餘,把指標從約 50 砍到 15,抓真實中等效應的能力反而提升約 45%。對做實驗平台或 SRE 指標設計的人,這是「少而獨立的信號常勝過全面監控」的具體佐證。

read source → observability

today's deep reads

deep · 01 後量子憑證為什麼不直接簽——Merkle Tree Certificate 怎麼把握手壓回比今天還小 deep · 02 合成鍵盤事件如何串成一鍵偷 token——拆 github.dev 的 VSCode 信任模型 deep · 03 Elixir 把 set-theoretic 型別變成預設——dynamic()、narrowing 與 verified bug 的編譯期帳本