Claude、デスクトップでのコンピューター操作機能をリリース
AnthropicはClaude Cowork・Claude Codeを通じて、macOSのリサーチプレビューとしてClaudeがマウス・キーボード・画面を操作できる「Computer Use」機能をデスクトップ向けにリリースした。APIやブラウザサンドボックスを超えたエージェント機能の大幅な拡張であり、コミュニティでは「多くのタスクにノートPCが不要になる」との反応が相次いだ。Pro・MaxプランのmacOSユーザーが利用可能。
8件 — 重要 5件
元記事を読む →AnthropicはClaude Cowork・Claude Codeを通じて、macOSのリサーチプレビューとしてClaudeがマウス・キーボード・画面を操作できる「Computer Use」機能をデスクトップ向けにリリースした。APIやブラウザサンドボックスを超えたエージェント機能の大幅な拡張であり、コミュニティでは「多くのタスクにノートPCが不要になる」との反応が相次いだ。Pro・MaxプランのmacOSユーザーが利用可能。
AlibabaはModelScope DevConにて、QwenおよびWanシリーズの新モデルを継続的にオープンソース化することを正式発表した。全サイズをカバーするモデルシリーズのリリース戦略が示され、コミュニティでは「Qwen 3.5 Coder」への期待が高まっている。一方、主要チームメンバーの離脱によるモデル品質への影響を懸念する声もある。
Meta関連研究者がDarwin Gödel Machineを拡張したHyperagents(DGM-H)を発表。タスク実行だけでなく、将来の改善を生成する手続き自体も改善できるメタレベルの自己改善を実現した。コーディング・論文レビュー・ロボティクス報酬設計・オリンピアード採点など複数ドメインへの転移が主張されており、自己改善ループ自体が手動設計だった従来手法の限界を克服するとしている。
Sakana AIは日本ユーザー向けに新モデルファミリー「Namazu alpha」を基盤とするSakana Chatを正式リリースした。上流バイアスを低減し日本の文脈・価値観を反映するよう後学習されたオープンモデルで、文化的ローカライズの実証例として位置付けられている。また読売新聞との協力で110万件のSNS投稿から情報操作ナラティブを分析するOSINTワークフローも公開した。
Cursorは数百万ファイルをミリ秒単位で検索できる「Instant Grep」をリリースし、コーディングエージェントの主要なシステムボトルネックであるリポジトリ規模の検索レイテンシを解消した。インデックス・アルゴリズムのトレードオフに関する技術ブログも公開されており、大規模コードベースでのエージェント反復速度の向上が期待される。
WebArena-Infinityは、ブラウザエージェント評価環境の構築コストを数ヶ月の人手作業から10時間・100ドル未満に削減したと主張する新ベンチマークを発表した。生成された難易度の高いタスクでは強力なオープンソースモデルでも50%未満のスコアにとどまり、従来のWebArena/OSWorldより大幅に難しい。エージェント向けRLに必要な自動生成・高品質環境の整備が加速する可能性がある。
ByteDance・Alibaba・Tencent・Baiduなど中国大手がそれぞれ独自モデルを展開し、OpenRouterの直近7日間トークン使用量ではXiaomiのMiMo-V2-Proが1.77兆トークンでトップに立つなど中国モデルが上位を占めている。Deepseekはイノベーターとして評価される一方、ByteDanceはHugging Faceにオープンウェイトモデルを公開していない唯一の大手として注目されている。米国の3ラボのみがランクインしており、AI開発の主導権が変化しつつあるとの見方が広がっている。
NVIDIAはHugging Faceで公開されたKimodoを発表。700時間のモーションキャプチャデータで学習したプロンプタブルな動作・タイムラインモデルで、人間とロボット両方のスケルトンをサポートする。生成メディア分野での注目度が高く、Luma Uni-1(推論と画像生成を同時に行うモデル)と並んで今サイクルの主要なメディア生成リリースとなった。