●重要OTHER
AnthropicのClaude Codeのソースコードがnpmレジストリのマップファイルを通じて流出し、約512,000行のTypeScriptコードが露出した。漏洩したコードには、マルチエージェントオーケストレーションシステム、隠し機能(「ultraplan」「kairos」など)、ターミナル上のペットシステム「BUDDY」などが含まれていることが判明した。AnthropicはDMCAによる削除要請を行ったが、一部は手続き上の問題で批判を受け、後に撤回された。
●重要MODEL
ArceeはApache 2.0ライセンスのオープンウェイト推論モデル「Trinity-Large-Thinking」をリリースした。総パラメータ数400B・アクティブ13Bのアーキテクチャを採用し、PinchBenchで2位、Tau2-AirlineでSOTAを達成するなど強力なエージェント性能を示している。OpenRouterを通じて即座に利用可能となり、米国発のオープンソースモデルとして注目を集めている。
●重要MODEL
Z.aiは画像・動画・ドキュメントレイアウト・デザイン草稿をネイティブに処理できるビジョンコーディングモデル「GLM-5V-Turbo」を発表した。ネイティブマルチモーダル融合、次世代CogViTエンコーダー、30以上のタスクに対する協調強化学習などの技術を採用している。TRAE、Tabbit、Vision Arenaなど複数のプラットフォームに即座に統合された。
●重要MODEL
PrismMLは1ビット精度で完全量子化されたLLM「Bonsai 8B」を発表した。8.2億パラメータながらメモリ使用量はわずか1.15GBで、フル精度モデルと比較して14倍小型・8倍高速・5倍省エネを実現している。Apache 2.0ライセンスでオープンソース公開されており、エッジデバイスでのAI実行を可能にする画期的な取り組みとして注目されている。
●重要PRODUCT
OpenAIはレート制限の急増と不正アカウントの排除を受け、全プランでCodexの使用制限をリセットした。この措置はコーディングエージェント市場における直接的な競争軸として解釈され、多くのユーザーから注目を集めた。また、Codexのコアはオープンソース化を意図していることも明らかにされた。
●重要RESEARCH
DeepMindの新論文「AI Agent Traps」は、エージェントセキュリティの脅威をモデルのジェイルブレイクではなくウェブページ・ドキュメント内の敵対的コンテンツに再定義した。HTML/CSSに隠されたプロンプトインジェクションが最大86%のシナリオで成功し、潜在的なメモリポイズニングは0.1%未満の汚染で80%以上の攻撃成功率を示している。ブラウジングや検索を多用するエージェントを開発・運用する上で重大なセキュリティリスクとなる。
PRODUCT
Hugging FaceはSFT・報酬モデリング・DPO・GRPOを統合したポストトレーニングフレームワーク「TRL v1.0」をリリースした。オープンなポストトレーニングの重要な統合として位置づけられており、本番環境対応のパッケージとして評価されている。16種類のRLフレームワークを比較した調査スレッドも公開され、TRL・VeRL・SLIMEなどの選択指針が提供されている。
MODEL
Technology Innovation Institute(TII)はオープン語彙の参照表現セグメンテーションモデル「Falcon Perception」と、3〜10倍大きいモデルと競合するとされる0.3BのOCRモデルをリリースした。マルチステージパイプラインや後期融合に依存せず、第1層から画像とテキストを混合するアーリーフュージョントランスフォーマーを採用している点が特徴的だ。