Cursor、Composer 2.5をリリースし大規模モデルトレーニングを発表
CursorはComposer 2.5を発表し、長時間タスクでの持続的な作業能力と命令追従の信頼性が向上したと説明した。さらに「SpaceXAI」との提携により、Colossus 2の100万H100相当を使用して10倍のコンピュートで大規模モデルをゼロからトレーニングする計画を明らかにした。コミュニティからはコスト効率と高いコーディング品質が評価されている。
8件 — 重要 5件
元記事を読む →CursorはComposer 2.5を発表し、長時間タスクでの持続的な作業能力と命令追従の信頼性が向上したと説明した。さらに「SpaceXAI」との提携により、Colossus 2の100万H100相当を使用して10倍のコンピュートで大規模モデルをゼロからトレーニングする計画を明らかにした。コミュニティからはコスト効率と高いコーディング品質が評価されている。
AnthropicはSDKおよびMCPサーバープラットフォームを提供するStainlessの買収を発表した。StainlessはAnthropicの初期API時代からSDK開発を支援してきた企業であり、今回の買収は開発者向けエルゴノミクスとプロトコル基盤の垂直統合戦略を示している。
CognitionはDevin Auto-Triageを発表し、バグ・アラート・インシデントに対応する常時稼働の「ファーストレスポンダー」として位置付けた。長期記憶、マネージャー/サブエージェント構造、PR自動生成機能を備えており、早期ユーザーのModalは既存の自社製トリアージ自動化より有用と評価している。
Qwen3.7 Max PreviewがArenaのテキスト部門で総合13位、数学7位、コーディング10位を記録し、AlibabはArenaのテキスト部門で6位のラボとなった。Qwen3.7 Plus Previewはビジョン部門で16位に入り、中国系ラボの継続的な性能向上を示している。
カリフォルニア州オークランドの連邦陪審は、イーロン・マスクがサム・アルトマン、OpenAI、Microsoftを訴えた裁判でマスク側の「慈善信託違反」の主張を時効(3年)を理由に棄却した。裁判官はOpenAIの非営利から営利への転換に関する実質的な争点には踏み込まなかった。マスクは「暦上の技術的問題」として第9巡回控訴裁判所に上訴する意向を示した。
Georgi GerganovがQwen3.6ファミリー向けのMTP(Multi-Token Prediction)サポートをllama.cppに追加したと発表した。A10G上でQwen3.6-27B denseモデルのスループットが25 tok/sから45 tok/s(+78%)に向上するなど、ローカル推論とホスト型サービスの性能差が縮小している。
MetaのAIRA研究は、計画エージェント(AIRA-Compose)と実装エージェント(AIRA-Design)に分割したアーキテクチャ探索により、24時間の計算予算内で350M・1B・3Bスケールすべてでllama 3.2を上回る性能を達成した。エージェントによるニューラルアーキテクチャ自動設計の実用性を示す成果として注目されている。
ByteDanceは、画像理解・動画理解・生成・編集を統合したマルチモーダルモデルLanceをオープンソースとして公開した。3Bビデオ、3B画像、3Bデコーダーの3コンポーネント構成を採用しており、オープンツールとしてのネイティブマルチモーダル統合という技術的意義がある。