AI Newsハイライト

8件 — 重要 7件

元記事を読む →
|
|
|
|
|
|
重要POLICY

LiteLLM PyPIパッケージへのサプライチェーン攻撃

LiteLLMのバージョン1.82.7と1.82.8がPyPIで侵害され、悪意のあるペイロードがクラウド認証情報やSSHキーなどを窃取しようとした。攻撃はLiteLLM CEOのGitHubアカウントを乗っ取ることで実行され、.pthファイルの脆弱性を悪用して検出を困難にした。エージェント型AIが普及する中、ファイルシステム全体が攻撃対象となるリスクが改めて浮き彫りになった。

重要PRODUCT

FigmaがMCPサーバーをオープンベータ公開、AIがデザインキャンバスを直接編集可能に

FigmaはMCPサーバーをオープンベータとして公開し、AIエージェントがデザインキャンバスを直接編集できるようになった。GitHub CopilotやCursorなどのクライアントからMCP経由で利用可能で、チームのデザインシステムを使ったコンポーネント生成も実現した。ツール呼び出しがチャットラッパーではなくプロダクトネイティブになる最も明確な事例の一つとなっている。

重要MODEL

OpenAIが次世代LLM「Spud」開発完了、Soraアプリを終了へ

OpenAIは次世代大規模言語モデルのコードネーム「Spud」の初期開発を完了したと報じられ、コンピュートリソース確保のためSoraアプリ・APIのサービスを終了することが発表された。同時にOpenAI Foundationが今後1年間で少なくとも10億ドルを支出する計画も明らかになり、Wojciech ZarembaがAIレジリエンス部門を率いることになった。コアモデルとインフラへの集中という戦略的方向転換を示している。

重要MODEL

Nous Research、Hermes Agent v0.4.0をリリース——個人向けエージェントランタイムとして本格化

Nous ResearchはHermes Agent v0.4.0を公開し、1週間で約300件のPRをマージ。OpenAI互換のResponses APIバックエンド、バックグラウンドでの自己改善ループ、コンテキスト圧縮機能などが追加された。最も注目される機能は、過去のレスポンスをレビューして再利用可能なメモリやスキルとして保持するかを判断するエージェントである。

重要RESEARCH

AI2がMolmoWebを公開、オープンウェイトのWebエージェントでSOTA達成

Allen Institute for AI(AI2)は、Molmo 2をベースにした4Bおよび8Bサイズのオープンソースブラウザエージェント「MolmoWeb」をリリースした。4つのWebエージェントベンチマークでオープンウェイトSOTAを達成し、一部のプロプライエタリエージェントをも上回る性能を示した。同時期にMicrosoftがAI2のリーダーシップチームを引き抜いたことで、オープン研究機関の人材確保への懸念も高まっている。

重要RESEARCH

Google ResearchがTurboQuantを発表——KVキャッシュを6倍圧縮、最大8倍高速化

Google ResearchはKVキャッシュ圧縮アルゴリズム「TurboQuant」を発表し、精度損失なしで少なくとも6倍のメモリ削減と最大8倍の速度向上を実現したと報告した。vLLMもGTC recap でModel Runner V2やハイブリッドメモリアロケータなど複数のシステム改善を発表し、マルチモーダルワークロードでP99スループットが最大2.5倍向上した。高価値な性能向上がモデルの大型化ではなくランタイム・メモリ・システム層から生まれるトレンドが加速している。

重要PRODUCT

Claudeがコンピューター操作機能を搭載、「Auto Dream」メモリ管理機能も追加

AnthropicはClaudeがユーザーのコンピューターを直接操作できる「Claude Cowork」機能をリサーチプレビューとして公開し、macOSのProおよびMaxユーザーが利用可能になった。またClaude Codeには「Auto Dream」機能が追加され、人間のREM睡眠を模倣して過去のセッション情報を整理・統合するメモリ管理を実現した。自律的なコーディングツールの権限設計に関する議論も活発化している。

POLICY

中国のオープンソースAIの台頭が米国のAIリーダーシップを脅かすと米諮問機関が警告

米国の諮問機関が、中国のオープンソースAI分野での急速な進展が米国のAIリーダーシップを脅かす可能性があると警告するレポートを発表した。ByteDance、Alibaba、Tencentなどの中国企業が競争力のあるモデルを次々とリリースしており、CursorなどのツールがKimi K2.5などの中国製モデルを採用する動きも見られる。コミュニティでは、中国モデルのコスト効率と性能の高さを評価する声が多く上がっている。