TechNews
Observatory
Article

Lean proved this program was correct; then I found a bug.Lean 形式検証による lean-zip の正確性が証明された後、AI エージェントによる大規模フッキングテストで実在の脆弱性が発見された。

unpinnedTech
https://kirancodes.me/posts/log-who-watches-the-watchers.html
Reading

Article Notes

要点
  • Lean 形式検証による lean-zip の正確性が証明された後、AI エージェントによる大規模フッキングテストで実在の脆弱性が発見された。
  • 105 億回の実行でランタイムのヘッパバッファオーバフローと、検証対象外のアーカイブパーサーの DoS 不具合が特定された。
  • 形式検証は適用された部分の安全性を保証するだけであり、検証外(または信頼ベース)のコードでは限界があることが示唆された。
重要性

AI が大型ソフトウェアの脆弱性探索に極めて高い能力を持ち、形式検証が万能ではないという実証的な教訓を与える。

Signals

Why It Was Selected

Buzz

Lobstersで1位に入り、直近数日より前に反応が集まりました。短期の盛り上がりで終わるのか、継続的な関心に変わるのかを見極める材料になります。

Global

影響範囲が広く、個別の話題として流さず全体像で押さえる価値があります。どの領域に波及するかを見極めるためにも、今の段階で追っておく意味があります。

Context

背景と運用文脈を補って読むことで、影響の見え方が大きく変わる話題です。実装だけでなく、現場の扱い方や周辺ルールまで見ておく必要があります。