Autais がお届けするトピック。時事の事実・引用元付き短いまとめ(SEO 軽め・原則更新なし)。
Googleは2026年5月19〜20日に年次開発者会議「Google I/O 2026」を開催する。次世代フラッグシップモデル「Gemini 4」をプレビュー発表予定。ARC-AGI2で84.6%、200万トークンのコンテキストウィンドウ、300ms未満のレイテンシを特徴とすると報じられている。
中国のDeepSeekが2026年4月24日、V4プレビュー版をMITライセンスで公開した。1.6兆パラメータ(アクティブ49B)のMoEアーキテクチャで、Claude Opus 4.7に匹敵するアジェンティックベンチマーク性能を、欧米フロンティアモデルの3分の1以下の推論コストで実現したとされる。
CloudflareがグローバルネットワークでLLMを実行するための独自推論エンジン「Infire」と、モデル重みを15〜22%圧縮する「Unweight」技術を公開。コールドスタート20秒以内・スループット20%向上を実現し、70以上のAIモデルへの統一APIを提供するAI Gatewayも拡充した。
中国の4つのAIスタートアップ(Z.ai・MiniMax・Moonshot・DeepSeek)が2026年4〜5月の12日間に高性能コーディングモデルを相次いで公開した。いずれもエージェント型エンジニアリング評価で欧米フロンティアモデルと同等水準に達しながら、推論コストが3分の1以下とされる。
OpenAI が GPT-5.5 Instant を ChatGPT のデフォルトモデルとして展開。医療・法務・金融など高リスクなプロンプトでの幻覚(ハルシネーション)を前モデル比52.5%削減。Plus/Pro 向けに Gmail・ファイル連携のパーソナライズ機能も追加。
Cloudflare がグローバルネットワーク上で LLM を効率的に実行するための独自推論エンジン「Infire」を公開。複数 GPU をまたいだ高速推論・メモリ使用量の最適化・起動時間の短縮を実現するとしている。
中国の4つのAIラボ(Z.ai・MiniMax・Moonshot AI・DeepSeek)が12日間のうちにコーディング特化の大規模言語モデルを相次いでリリース。いずれも西洋最先端モデルの3分の1以下のコスト水準でほぼ同等の性能を達成したとされる。
Alibaba が Qwen3.6-Plus を発表。エージェントコーディング・マルチモーダル推論で大幅な性能向上を果たし、SWE-bench Pro など 6 つのコーディング・エージェントベンチマークで同時首位。上位フラッグシップモデルはクローズドウェイトに移行し、API のみで提供。
Elon MuskのxAIが開発するGrokシリーズの最新版「Grok 4.20」が2026年2月17日に公開ベータとして公開。週次でアップデートされ、マルチエージェントAI・200万トークンのコンテキストウィンドウ・ハルシネーション率4.2%への削減などを特徴とする。
OpenAIが4月23日にリリースしたGPT-5.5は、同社史上最速のAPIローンチを記録し、Codexの収益が1週間で倍増したと発表。5月5日にはGPT-5.5 InstantがChatGPTのデフォルトモデルに切り替えられた。
2026年5月5日、GoogleのGemini 3.2 FlashがiOS公式アプリとGoogle AI Studioに正式発表なしで出現。Gemini 3 Flashより高速・高性能で、入力トークン単価は0.25ドル/百万トークンと低価格設定。5月19日のGoogle I/O 2026での正式発表が予想される。
OpenAIは2026年5月5日、GPT-5.5 Instant をChatGPTの新しいデフォルトモデルとして全ユーザーへ展開。応答の精度と簡潔さが向上し、不要な絵文字が削減された。有料ユーザーは旧GPT-5.3 Instantへのアクセスを3カ月間維持できる。
中国のDeepSeekが2026年4月24日、V4-Pro(1.6兆パラメータ)とV4-Flash(2840億パラメータ)を MIT ライセンスで公開。クローズドモデルに匹敵する性能を持ちながら、商用利用・ファインチューニング・ローカル実行が自由に可能なオープンソースモデル。
カナダのエンタープライズAI企業CohereとドイツのAleph Alphaが合併を発表。カナダ・ドイツ両政府の承認を受け、「主権AI」志向の欧米企業向けサービスを統合した組織として再編する。米国ビッグテックに依存しないAI基盤の選択肢として注目される。
2026年5月初旬の12日間で、中国の4つのAIラボ(Z.ai・MiniMax・Moonshot・DeepSeek)がオープンウェイトのコーディングモデルを相次いでリリース。AIモデルの開発加速と中国AI産業の競争激化を示す動向として注目される。
AnthropicはClaude Opus 4.7を正式リリース。Opus 4.6から高度ソフトウェア開発タスクの精度が大幅に向上し、画像解像度も改善。クリエイティブ・専門的業務の品質も向上し、Claude Securityの基盤モデルとして採用された。
Keshav Ramji 氏らが 2026 年 4 月 24 日に arXiv へ投稿。自然言語の長い chain-of-thought の代わりに予約語彙の短い抽象トークン列で推論する Abstract Chain-of-Thought (ACoT) を提案し、推論トークンを最大 11.6 倍削減しつつ性能を維持。
Yeonjun In 氏らが 2026 年 4 月 21 日に arXiv へ投稿。大規模推論モデルの安全性リスクは「推論構造そのもの」に起因すると主張し、わずか 1K 例の教師付きファインチューニングで安全性配置を達成する AltTrain を提案。
目的に合った入口からお気軽にどうぞ。すべてカジュアル相談OKです。