vatt'ghern jaskier's ballads

2026.05.18 —— 今日 10 則

TODAY'S THREAD BuildBuddy 把 Bazel cache 切成 chunk、Figma 從全表掃描改成 CDC、Slack 的 agent 不再傳訊息歷史——三件事都在重新討論「不要重做已經做過的事」。

10 items infra · 5 industry · 2 ai · 1 systems · 1 storage · 1
0 / 10 read
#03

Slack 的多 agent 安全調查不傳訊息歷史——Director / Critic / Timeline 三件式上下文

Slack 安全工程處理長期 agent 調查的核心設計:agent 之間完全不傳遞訊息歷史,三個共享資源(Director's Journal、Critic's Review、Critic's Timeline)取代了傳統的 message buffer。Critic 用較強模型逐項評分(0.0–1.0 可信度),把缺乏證據的幻覺擋在 timeline 之外。170,000 條已審查 findings 中 37.7% 被標為可信、25.4% 高度可能、15.4% 誤判。

read source → deep ↗ AI-agent

#10

Visual Studio 為 C++ 專案加入 Segment Heap 支援——manifest 嵌入啟用、無連結器旗標

Microsoft 把 Segment Heap 的 C++ 啟用方式從 linker 旗標 / 註冊表黑名單,改成 VS MSBuild Project Properties 內建的 Enable Segment Heap 開關,CMake 則由 SegmentHeap.cmake helper 提供 allow/exclude 環境變數。Segment Heap 比傳統 NT Heap(含 LFH)有強化 vuln 保護、較低碎片、多核擴展性,但啟用走 manifest 嵌入:<heapType>SegmentHeap</heapType> 必須出現在 RT_MANIFEST。文章未給具體的碎片化或效能跑分。

read source → Windows

#01

BuildBuddy 把 content-defined chunking 帶進 Bazel remote cache——40% 上傳資料量蒸發

BuildBuddy 用 FastCDC 演算法(rolling hash + 每 ~512 KiB 一次稀有 pattern 切點)把 Bazel 的 build 產物切成內容定義的 chunk,僅對 ≥2 MiB 的檔案啟用。內部 repo benchmark 顯示上傳資料減 40%、cache disk 縮小 40%、寫入路徑去重率 85%,整體 cache 流量節省 20–40%。兩週實測累積跳過 ~300 TiB 重複資料,尖峰時段每小時節省 4 TiB。

read source → deep ↗ Bazel

#02

Cloudflare Browser Run 搬到 Containers——並行數翻 4 倍、單區密度從 5K 到 500K

Browser Run 從共用 Browser Isolation 容器改成 Durable Object 直連的 Container,Workers binding 每分鐘可起 60 個瀏覽器、同時並行 120 個(前一代上限的 4 倍)。狀態管理從 Workers KV(~30 秒最終一致)改為 D1 + Queues,SQLite 交易批次 100 row 寫入消除分配競態。單一 region 容器密度從 5K 拉到 500K,Quick Actions 回應時間下降超過 50%。

read source → Cloudflare

#04

Databricks 把 rate limiter 從 Redis 換成 sharded in-memory——尾延遲降一個數量級

Databricks 棄掉以 Redis 為中心的 rate limiter,改用內部路由層 Dicer 把 key 切片落到 server 本地記憶體,每個 server 是自己 slice 的權威來源。token bucket 允許負值以追蹤超額,每個 client 每 100 ms 批次回報計數,整體系統容忍 ~5% policy 超額換取速度與韌性。P99 從 10–20 ms 降一個量級、單點故障消除。

read source → rate-limiting

#05

Figma 把資料管道從 6 小時 cron 改成 PostgreSQL CDC——延遲降到 3 小時、省下百萬美元 RDS

Figma 原本每天用一次 cron 全表 dump 同步到 Snowflake,2023 年達 6 小時以上、需要多個專屬 RDS replica。新管道讀 PostgreSQL WAL → Kafka → S3 snapshot → Snowflake 增量合併,預設 3 小時、最快可調到分鐘級。Snapshot bootstrap 與 CDC offset 重疊解決切換點漏資料,每週用 full-table cell-by-cell 比對作為審計。

read source → deep ↗ CDC

#08

GitHub Enterprise Server 把搜尋從 Elasticsearch 多節點換成 CCR——HA 不再卡死

GHES 的 leader/follower HA 過去把 Elasticsearch 配成多節點 cluster,遇到主分片被搬到 read-only replica、replica 又下線維護時就會卡死。新架構改成每台機器跑單節點 Elasticsearch,靠 Cross Cluster Replication 在持久層複製索引資料,cluster 層複雜性消失。文章沒給延遲與恢復時間數據,重點在架構正確性而非效能跑分。

read source → Elasticsearch

#09

Meta Labyrinth 1.1 加入非同步訊息備份——離線收件人也能加密入庫

Labyrinth 1.1 引入一個新的 sub-protocol:傳送者把每則訊息用「收件人的訊息加密金鑰」包好,直接塞進收件人的加密備份儲存,收件人在離線、換機、長時間未登入後仍能恢復。比喻是「把密封信封丟進只有收件人能開的鎖箱」——sender-side 加密 + recipient-specific key。1.0 要求收件人在線才能備份,1.1 解開這個依賴。

read source → E2EE

#06

Anthropic 簽下 SpaceX Colossus 1 全部容量——300 MW、22 萬張 NVIDIA GPU

Anthropic 在一個月內取得 SpaceX Colossus 1 資料中心全部運算容量:300 MW 新增、超過 22 萬張 NVIDIA GPU。同步上線:Claude Code 五小時用量上限翻倍(Pro / Max / Team / Enterprise)、Pro 與 Max 取消尖峰時段限制、Opus 模型 API 速率大幅上調。背景是更大盤的 Amazon 5 GW、Google/Broadcom 5 GW、Microsoft NVIDIA 300 億美元 Azure 容量、Fluidstack 500 億美元基礎設施投資。

read source → AI-infra

#07

PHP 從自訂授權改成 BSD-3-Clause——25 年的 GPL 不相容包袱解掉

PHP 8.6 將把核心授權從 PHP License 3.01(非 OSI 批准)改成 BSD-3-Clause,RFC 票決全票通過。原因是 PHP 與 Zend Engine 授權都不相容 GPL、廣告條款限制衍生命名、修改授權的權限被限縮給特定組織——Debian 等發行版過去被迫 patch 後重新打包。既有 3.01 授權繼續有效,使用者可沿用或換新授權。

read source → license

today's deep reads

BuildBuddy 把 FastCDC 帶進 Bazel——300 TiB 重複資料消失

rolling hash 切點、稀有 pattern 觸發、2 MiB 啟用門檻——BuildBuddy 把檔案層 dedup 拆解到 sub-file chunk 層的三段設計。

agent 的上下文管理,從零講起——Slack 為什麼不傳訊息歷史

長期 agent 任務的 message buffer 為什麼會塞爆?Director's Journal、Critic's Review、Critic's Timeline 三件式怎麼把這個問題從訊息層拉到資源層?

Figma 的資料管道升級記——從 6 小時 cron 到分鐘級 CDC 的三年路

2023 年的全表 cron dump、2024 年改造 CDC 管線、2026 年補上每週 cell-by-cell 審計——一條資料管線怎麼從每天一次走到分鐘級。