NVIDIA Nemotron 3 Ultra 550B MoEモデルをオープンリリース
NVIDIAは550Bパラメータ(アクティブ55B)のハイブリッドMoEモデル「Nemotron 3 Ultra」をオープンリリースした。1Mコンテキスト対応で、エージェントタスクに最適化されており、最大5倍高速・30%低コストを謳う。vLLM、Modal、Togetherなど主要プラットフォームでday 0から利用可能で、OpenMDW 1.1ライセンスで重みや学習レシピも公開された。
8件 — 重要 5件
元記事を読む →NVIDIAは550Bパラメータ(アクティブ55B)のハイブリッドMoEモデル「Nemotron 3 Ultra」をオープンリリースした。1Mコンテキスト対応で、エージェントタスクに最適化されており、最大5倍高速・30%低コストを謳う。vLLM、Modal、Togetherなど主要プラットフォームでday 0から利用可能で、OpenMDW 1.1ライセンスで重みや学習レシピも公開された。
AnthropicはClaudeが現在Anthropicのマージコードの80%以上を生成しており、エンジニアの生産性が8倍向上したと発表した。内部テストではMythos PreviewがトレーニングスクリプトをClaude Opus 4の約3倍に対し約52倍高速化したと報告。同社はフロンティアAI開発の一時停止オプションの必要性にも言及し、ガバナンスの緊急性を訴えた。
CloudflareはVite、Vitest、Rolldownなどを手がけるVoidZeroチームを買収した。ViteはMITライセンスでベンダー中立を維持し、CloudflareはViteエコシステム向けに100万ドルのOSSファンドも設立する。開発者からはCloudflareがLLMによるアプリ開発向けの統合スタックを構築しているとの見方が広がっている。
ChatGPTが月間アクティブユーザー10億人に到達し、史上最速のアプリとなった。Threadsが100万ユーザーを5日で達成した記録を大幅に上回る成長速度を示している。ただし収益化の深さについては懐疑的な意見もあり、消費者ARPUは約1ドル程度と推定されている。
OpenAIのSam Altman、AnthropicのDario Amodei、Google DeepMindのDemis Hassabisらが共同書簡に署名し、AIによる生物兵器設計リスクへの対策として合成核酸注文のスクリーニング義務化を米議会に求めた。提案は合成の禁止ではなく、不審な注文・顧客のフラグ付けを目的とした監視メカニズムの導入を求めるもの。AIが生物学的知識の障壁を低下させているとの懸念が背景にある。
Stanfordの研究で、16人の米国契約法教授が2,918件のブラインド比較評価を行った結果、LLM(Gemini 2.5 Pro)の回答が平均75.33%の勝率で教授の回答を上回った。LLMの回答が有害と判定された割合は3.53%で、教授の12.06%を大幅に下回った。法律分野はRAGシステムとの親和性が高く、大規模な判例・法令コーパスを活用できる点が強みとされている。
OpenAIはPlus・Proユーザー向けにChatGPTのメモリシステムをアップグレードし、メモリサマリー機能、より細かいステアリングコントロール、2倍のメモリ容量を提供開始した。これは保存メモリから「ドリーミング」を経た長期的な研究の成果として位置づけられている。また、Responses・Completions APIへのモデレーションスコア追加も同時に発表された。
Ideogramは9.3BパラメータのテキストtoイメージDiTモデル「Ideogram 4.0」をオープンウェイトで公開し、ComfyUIネイティブサポートやJSON構造化プロンプティングに対応した。ただし、コミュニティからはモデルが強くセーフティフィルタリングされており、透かし入り・商用ライセンスなしという制約が実用上の障壁になるとの批判が上がっている。