Moonshot AIが、1兆パラメータのMixture-of-Expertsモデル「Kimi K2」をMITライセンスで公開しました。このモデルは、新しいMuonClipオプティマイザを使用して15.5兆トークンで学習され、SWE-Bench Verified (65.8%) やTAU2 (58.4%) などのベンチマークで最先端の結果を達成しています。GPT-4.1やSonnet 4と非思考タスクで競合し、vLLMやHugging Faceでも利用可能です。
xAIがGrok-4を発表し、Perplexity ProおよびMaxの購読者向けに提供を開始しました。「最も検閲の少ないフロンティアモデル」とされており、長文コンテキスト処理で優れた性能を発揮しますが、急ぎの事後学習が批判されています。特に、イーロン・マスクのツイートを情報源として参照する傾向が指摘されています。
Mistral AIがDevstral SmallおよびMedium 2507モデルを更新し、性能向上とコスト効率の改善を実現しました。開発者には、より堅牢なツール呼び出し性能のために2505バージョンから2507への切り替えが推奨されています。
GoogleがVeo 3をGeminiアプリでAI UltraおよびPro購読者向けに提供開始しました。この機能により、ユーザーは写真を8秒の動画に変換し、音声を加えることができます。
MicrosoftがPhi-4-mini-flash-reasoningをHugging Faceで公開しました。これはPhi-4-miniアーキテクチャをベースにした軽量なオープンモデルで、推論能力が強化されています。