AI Newsハイライト

8件 — 重要 6件

元記事を読む →
|
|
|
|
|
|
重要PRODUCT

Claude CodeにComputer Use機能が追加、クローズドループ検証を実現

AnthropicはClaude CodeにComputer Use機能を追加し、エージェントがアプリを開き、UIをクリックし、CLIから直接構築したものをテストできるようになった。Pro/Maxユーザー向けのリサーチプレビューとして提供され、コード→実行→UI検査→修正→再テストという閉ループ検証を可能にする。エンジニアたちはこれを信頼性の高いアプリ開発における「欠けていたピース」と評価している。

重要MODEL

Anthropic、最強モデル「Claude Mythos」をテスト中と判明——データリークで存在が露呈

AnthropicがCMSの設定ミスによるデータリークにより、「Claude Mythos」と呼ばれる新AIモデルをテスト中であることが明らかになった。このモデルは既存のOpusラインを超える「Capybara」という新ティアに属し、推論・コーディング・サイバーセキュリティタスクにおいて「段階的な能力向上」を示すとされる。Anthropicは悪用リスクを懸念し、初期アクセスをサイバーセキュリティ防衛強化が可能な組織に限定している。

重要MODEL

AlibabaがQwen3.5-Omniを発表——音声・映像・テキストを統合したマルチモーダルモデル

AlibabaはQwen3.5-Omniを発表し、テキスト・画像・音声・動画のネイティブ理解、スクリプトレベルのキャプション生成、組み込みWeb検索と関数呼び出しを実現した。10時間の音声・720p動画400秒のサポート、113言語の音声認識、36言語の音声出力に対応し、一部設定でGemini 3.1 Proを上回ると主張している。「音声ビジュアルバイブコーディング」デモでは、音声指示からWebサイトやゲームを構築する能力を披露した。

重要PRODUCT

Nous ResearchのHermes Agentが大型アップデート——マルチエージェントプロファイルでオープンエージェントOSへ

Nous ResearchがHermes Agentの大型アップデートをリリースし、各ボットが独自のメモリ・スキル・履歴・ゲートウェイ接続を持つマルチエージェントプロファイル機能を追加した。改善されたコンパクション、低ブロート、強化された適応性により、OpenClaw系セットアップからの移行が相次いでいる。これによりHermesは「パーソナルアシスタント」から再利用可能なエージェントOS抽象化へと進化しつつある。

重要OTHER

llama.cppがGitHub Stars 10万件を突破——ローカルエージェントワークフローの転換点

llama.cppがGitHub Stars 10万件を達成し、作者の@ggerganovは2026年をローカルエージェントワークフローのブレイクアウトイヤーになり得ると述べた。有用な自動化にはフロンティア規模のホスト型モデルは不要であり、適切なポータブルランタイムスタックの方が重要だと主張している。クロスハードウェア・非ベンダーロックインのインフラの重要性も強調された。

重要PRODUCT

ShopifyのDSPy活用事例——年間コストを550万ドルから7万3千ドルに削減

ShopifyがDSPyを活用したAIシステム最適化の事例を公開し、年間コストを550万ドルから7万3千ドルへと大幅削減したことが明らかになった。ビジネスロジックを分解し、DSPyでインテントをモデル化し、パフォーマンスを維持しながら小型最適化モデルに切り替えることで実現した。この事例は、大規模言語モデルの実用的なコスト最適化手法として注目を集めている。

MODEL

Qwen 3.6 Plusが目撃される——100万トークンコンテキストで3月30日リリース予定

Qwen 3.6 Plusの存在がリークされ、100万トークンという巨大なコンテキストサイズを持つことが判明した。3月30日のリリースが予定されており、コミュニティはQwen 3.5で見られた「過剰思考問題」の解消や、397BモデルでのソTA性能達成への期待を示している。プロンプトと補完データの収集による反復学習の改善にも焦点が当てられている。

PRODUCT

AnthropicのClaude Proサブスクリプション制限問題が多数報告——ユーザーの不満が噴出

AnthropicがClaude AIのセッション制限をピーク時間帯(平日午前5時〜11時PT)に調整したことで、Pro・Maxユーザーから大きな不満が寄せられている。「Hello」と天気を聞くだけで使用量の7%が消費されたという報告や、2時間のWordPressプラグイン開発でセッション上限に達したという事例が相次いでいる。透明性の欠如に対する批判が強く、解約やGeminiへの乗り換えを検討するユーザーも増加している。