人工知能の今を、世界にいち早く。

𝕏inrss
Research

ベンチマークと研究コミュニティ

Command A+の翻訳ベンチ、Qwen-VLA、NeurIPS 2026 May Newsletterなどを掲載。

基盤モデル

Anthropic Claude Opus 4.8がKVキャッシュを維持したままmid-taskのinstructions更新に対応し、コスト・レイテンシ両面で改善。StepFunはagentic向けオープンウェイト「Step 3.7 Flash」を投入。Alibaba Tongyi LabはVision-Language-Action統合モデル「Qwen-VLA」(Qwen3.5-4B + 1.15B DiT)を発表。Gemini 3.5 Proの来月リリース観測も浮上。Cohere Command A+は翻訳ベンチで主要モデルを総なめした。

特化モデルが汎用LLMをベンチで上回るアピール

Cohere Command A+が翻訳で主要モデル超え、Parakeet-TDT v3がSTTで圧倒的速度を出すなど、ジャンル特化モデルの存在感が増している。

イベント

NeurIPS 2026 May Newsletterが公開。Databricks Data+AI Summitの開催告知も進んでいる。