エージェント型コーディングがOSを越えて主戦場化
Codex Windows対応、grok-build-0.1、Step 3.7 Flash、Pika Founder Kit on Claude MCPと、専用モデルとComputer Useの組み合わせが一気に揃った。モバイルからデスクトップを動かす運用が現実解になりつつある。
人工知能の今を、世界にいち早く。
256K contextと最大8体までの並行エージェント実行に対応。$1/M input・$2/M outputという低価格でClaude/Codex対抗の選択肢が増えた。
Codex Windows対応、grok-build-0.1、Step 3.7 Flash、Pika Founder Kit on Claude MCPと、専用モデルとComputer Useの組み合わせが一気に揃った。モバイルからデスクトップを動かす運用が現実解になりつつある。
WebMCP、Chrome DevTools for agents、Google ADKの長時間稼働エージェント、評価フレームワークの整備など、本番運用に耐える評価・実行基盤が前面に出てきた。一方で、Web経由の間接プロンプトインジェクションとSEO poisoningを組み合わせた新攻撃手法も警告されている。
fal Assets、Luma Agents、Runway APIの外部モデル統合により、生成物の管理とワークフロー横断が一気に進む。クリエイティブ系AIは生成だけではなく、保管、検索、再利用まで含む運用基盤へ広がっている。
Anthropic Claude Opus 4.8がKVキャッシュを維持したままmid-taskのinstructions更新に対応し、コスト・レイテンシ両面で改善。StepFunはagentic向けオープンウェイト「Step 3.7 Flash」を投入。Alibaba Tongyi LabはVision-Language-Action統合モデル「Qwen-VLA」(Qwen3.5-4B + 1.15B DiT)を発表。Gemini 3.5 Proの来月リリース観測も浮上。Cohere Command A+は翻訳ベンチで主要モデルを総なめした。
Runwayが一人月製作事例「The Rogue」の舞台裏を公開し、Runway APIにSeedance 2.0やGPT Image 2など外部モデルを統合してハブ化を進めている。Vidu Story Gridチャレンジも始動し、画像からシネマティック映像への変換コンペが開催中。
Together AIがArtificial Analysis計測でSTT最速2モデルを提供。NVIDIA Parakeet-TDT 0.6B v3を含み、20時間音声を10秒未満で文字起こしできる水準に到達した。
fal Assetsがローンチし、画像・動画・音声・3Dを統合ライブラリ化してセマンティック検索を提供。Databricks Unity CatalogではManaged Iceberg、Iceberg v3、Foreign IcebergがGAになり、オープンレイクハウス基盤が前進。Pika Founder Starter KitがClaude MCPで利用可能になり、Google ADKは長時間稼働エージェントの構築フローを整備。Chromium WebMCPはエージェント信頼性向上と専用DevToolsを公開した。
NeurIPS 2026 May Newsletterが公開。Databricks Data+AI Summitの開催告知も進んでいる。