トピック / #LLM（大規模言語モデル） | レポート・コラム

2026.06.02 US

NVIDIA、Computex 2026 で Nemotron 3 Ultra 550B を発表―オープンウェイトの推論特化大規模モデル

NVIDIAがComputex 2026で公開したNemotron 3 Ultra 550Bは、550億パラメータのオープンウェイトLLMで、推論・エージェント用途に最適化。GPT-4.5を複数ベンチマークで上回ると主張し、オープンモデル最前線の競争が激化している。

#Nvidia #LLM（大規模言語モデル） #Open Weights label+2

campaignトピック article ニュース

2026.06.02 US

OpenAI、GPT-4.5 を6月27日に API 廃止へ―新モデル移行を開発者に促す

OpenAI が GPT-4.5 の API 廃止日を2026年6月27日と発表。GPT-4o・GPT-5 への移行を推奨しており、既存アプリケーションを持つ開発者は4週間以内の移行対応が必要となる。

#OpenAI #LLM（大規模言語モデル） #Api label+2

campaignトピック article ニュース

2026.05.29

IBM Granite 4.1、オープンソースとして公開——コード・言語・推論の3系統で前世代比で性能向上

概要 > ※本記事は? ?開? 報をもとに編集部が再構成したサマリです。一次? 報は出? ?欄をご参? ?ください。 IBMは2026年4月29日、企業向けAIモデルシリーズ「IBM Granite …

#Enterprise Ai #LLM（大規模言語モデル） #Open Source label+2

campaignトピック article ニュース

2026.05.28

MistralがオープンソースMoE「Mistral Small 4」を公開——推論・マルチモーダル・コーディングを1モデルに統合しApache 2.0で配布

フランスのMistral AIが2026年3月16日、4つの独立モデル（Small・Magistral・Pixtral・Devstral）を1つのMixture-of-Experts構造に統合した「Mistral Small 4」をApache 2.0ライセンスで公開した。推論強度を動的に調整でき、APIコストを大幅に削減できる。

#LLM（大規模言語モデル） #Open Source #Moe label+3

campaignトピック article ニュース

2026.05.28

AWS Bedrock、リクエストレベルのコスト帰属機能をリリース——チーム・プロジェクト別のAI利用コストを可視化

AWSがBedrockにリクエストレベルの使用量帰属（usage attribution）機能を追加。APIリクエスト単位でチーム・アプリ・プロジェクトを識別するタグを付与でき、部門別・プロジェクト別のAI利用コスト管理が可能になった。

#LLM（大規模言語モデル） #Aws #Bedrock label+3

campaignトピック article ニュース

2026.05.28

Mistral AI、独自チップ設計を検討しAirbus・BMWとの製造業AI提携も発表——欧州AI自立戦略の焦点に

フランスのMistral AIが独自チップ設計の検討に入ったとCNBCが報道。同日、AirbusおよびBMWとの製造業向けAI活用で提携を締結したことも発表された。欧州のAI自立戦略において、モデル開発からハードウェアへの垂直統合を視野に入れる重要な転換点となる。

#LLM（大規模言語モデル） #Ai Chip #ミストラル（Mistral） label+4

campaignトピック article ニュース

2026.05.20 US

Google I/O 2026 — Gemini 3.5 Flash と Gemini Spark 発表：4倍高速化と24時間常駐エージェント

Google I/O 2026（5月19日）で、Gemini 3.5 Flash と常駐型 AIエージェント Gemini Spark を発表。3.5 Flash は他のフロンティアモデルと比較して出力トークン速度が4倍で、コーディング・エージェント・マルチモーダルベンチマークで Gemini 3.1 Pro を上回る。Spark は24時間365日バックグラウンドで動作し、Google AI Ultra（月100ドル）ベータ対象。

#Google #Ai Agent #LLM（大規模言語モデル） label+2

campaignトピック article ニュース

2026.05.11 US

Google I/O 2026（5月19日）でGemini 4発表へ——ARC-AGI2スコア84.6%・2M トークンコンテキスト

Googleは2026年5月19〜20日に年次開発者会議「Google I/O 2026」を開催する。次世代フラッグシップモデル「Gemini 4」をプレビュー発表予定。ARC-AGI2で84.6%、200万トークンのコンテキストウィンドウ、300ms未満のレイテンシを特徴とすると報じられている。

#Google #LLM（大規模言語モデル） #Gemini label+1

campaignトピック article ニュース

2026.05.11 GLOBAL

DeepSeek V4、MIT ライセンスで公開——Claude Opus 4.7 と肩を並べる性能を3分の1以下のコストで

中国のDeepSeekが2026年4月24日、V4プレビュー版をMITライセンスで公開した。1.6兆パラメータ（アクティブ49B）のMoEアーキテクチャで、Claude Opus 4.7に匹敵するアジェンティックベンチマーク性能を、欧米フロンティアモデルの3分の1以下の推論コストで実現したとされる。

#LLM（大規模言語モデル） #Open Source #ディープシーク（DeepSeek） label+1

campaignトピック article ニュース

2026.05.11 US

Cloudflareが独自LLM推論エンジン「Infire」と重みの圧縮技術「Unweight」を公開

CloudflareがグローバルネットワークでLLMを実行するための独自推論エンジン「Infire」と、モデル重みを15〜22%圧縮する「Unweight」技術を公開。コールドスタート20秒以内・スループット20%向上を実現し、70以上のAIモデルへの統一APIを提供するAI Gatewayも拡充した。

#LLM（大規模言語モデル） #Infrastructure #Inference label+1

campaignトピック article ニュース

2026.05.11 GLOBAL

中国AI勢が12日間で4モデル一斉公開——欧米フロンティアに匹敵するコーディング性能を3分の1のコストで

中国の4つのAIスタートアップ（Z.ai・MiniMax・Moonshot・DeepSeek）が2026年4〜5月の12日間に高性能コーディングモデルを相次いで公開した。いずれもエージェント型エンジニアリング評価で欧米フロンティアモデルと同等水準に達しながら、推論コストが3分の1以下とされる。

#LLM（大規模言語モデル） #Open Source #ディープシーク（DeepSeek） label+2

campaignトピック article ニュース

2026.05.10

OpenAI、GPT-5.5 Instant をリリース — 幻覚を52.5%削減しデフォルトモデルに昇格

OpenAI が GPT-5.5 Instant を ChatGPT のデフォルトモデルとして展開。医療・法務・金融など高リスクなプロンプトでの幻覚（ハルシネーション）を前モデル比52.5%削減。Plus/Pro 向けに Gmail・ファイル連携のパーソナライズ機能も追加。

#OpenAI #LLM（大規模言語モデル） #ChatGPT label+2

campaignトピック article ニュース

2026.05.09 US

Cloudflare、独自開発の LLM 推論エンジン「Infire」を公開——グローバルネットワーク上でのAI実行を効率化

Cloudflare がグローバルネットワーク上で LLM を効率的に実行するための独自推論エンジン「Infire」を公開。複数 GPU をまたいだ高速推論・メモリ使用量の最適化・起動時間の短縮を実現するとしている。

#LLM（大規模言語モデル） #Inference #Ai Infrastructure label+2

campaignトピック article ニュース

2026.05.09 GLOBAL

中国 4 ラボが12日間でコーディングモデルを集中リリース——GLM-5.1・Kimi K2.6・MiniMax M2.7・DeepSeek V4

中国の4つのAIラボ（Z.ai・MiniMax・Moonshot AI・DeepSeek）が12日間のうちにコーディング特化の大規模言語モデルを相次いでリリース。いずれも西洋最先端モデルの3分の1以下のコスト水準でほぼ同等の性能を達成したとされる。

#LLM（大規模言語モデル） #Open Source #ディープシーク（DeepSeek） label+3

campaignトピック article ニュース

2026.05.08 GLOBAL

Alibaba、エンタープライズ向けエージェント AI を加速する Qwen3.6-Plus を発表

Alibaba が Qwen3.6-Plus を発表。エージェントコーディング・マルチモーダル推論で大幅な性能向上を果たし、SWE-bench Pro など 6 つのコーディング・エージェントベンチマークで同時首位。上位フラッグシップモデルはクローズドウェイトに移行し、API のみで提供。

#LLM（大規模言語モデル） #Alibaba #Qwen label+1

campaignトピック article ニュース

2026.05.07

xAIのGrok 4.20が公開ベータでローンチ—週次アップデート・マルチエージェント・200万トークンコンテキスト

Elon MuskのxAIが開発するGrokシリーズの最新版「Grok 4.20」が2026年2月17日に公開ベータとして公開。週次でアップデートされ、マルチエージェントAI・200万トークンのコンテキストウィンドウ・ハルシネーション率4.2%への削減などを特徴とする。

#LLM（大規模言語モデル） #イーロン・マスク（Elon Musk・xAI CEO） #xAI label+2

campaignトピック article ニュース

2026.05.07

GPT-5.5、OpenAI史上最速のAPIローンチ記録—Codex収益は1週間で倍増

OpenAIが4月23日にリリースしたGPT-5.5は、同社史上最速のAPIローンチを記録し、Codexの収益が1週間で倍増したと発表。5月5日にはGPT-5.5 InstantがChatGPTのデフォルトモデルに切り替えられた。

#OpenAI #LLM（大規模言語モデル） #ChatGPT label+2

campaignトピック article ニュース

2026.05.07

GoogleのGemini 3.2 Flash、正式発表前にiOSアプリとAI Studioに出現—I/O 2026での正式公開を前倒し示唆

2026年5月5日、GoogleのGemini 3.2 FlashがiOS公式アプリとGoogle AI Studioに正式発表なしで出現。Gemini 3 Flashより高速・高性能で、入力トークン単価は0.25ドル/百万トークンと低価格設定。5月19日のGoogle I/O 2026での正式発表が予想される。

#Google #LLM（大規模言語モデル） #Gemini label+1

レポート・コラム：トピック

NVIDIA、Computex 2026 で Nemotron 3 Ultra 550B を発表―オープンウェイトの推論特化大規模モデル

OpenAI、GPT-4.5 を6月27日に API 廃止へ―新モデル移行を開発者に促す

IBM Granite 4.1、オープンソースとして公開——コード・言語・推論の3系統で前世代比で性能向上

MistralがオープンソースMoE「Mistral Small 4」を公開——推論・マルチモーダル・コーディングを1モデルに統合しApache 2.0で配布

AWS Bedrock、リクエストレベルのコスト帰属機能をリリース——チーム・プロジェクト別のAI利用コストを可視化

Mistral AI、独自チップ設計を検討しAirbus・BMWとの製造業AI提携も発表——欧州AI自立戦略の焦点に

Google I/O 2026 — Gemini 3.5 Flash と Gemini Spark 発表：4倍高速化と24時間常駐エージェント

Google I/O 2026（5月19日）でGemini 4発表へ——ARC-AGI2スコア84.6%・2M トークンコンテキスト

DeepSeek V4、MIT ライセンスで公開——Claude Opus 4.7 と肩を並べる性能を3分の1以下のコストで

Cloudflareが独自LLM推論エンジン「Infire」と重みの圧縮技術「Unweight」を公開

中国AI勢が12日間で4モデル一斉公開——欧米フロンティアに匹敵するコーディング性能を3分の1のコストで

OpenAI、GPT-5.5 Instant をリリース — 幻覚を52.5%削減しデフォルトモデルに昇格

Cloudflare、独自開発の LLM 推論エンジン「Infire」を公開——グローバルネットワーク上でのAI実行を効率化

中国 4 ラボが12日間でコーディングモデルを集中リリース——GLM-5.1・Kimi K2.6・MiniMax M2.7・DeepSeek V4

Alibaba、エンタープライズ向けエージェント AI を加速する Qwen3.6-Plus を発表

xAIのGrok 4.20が公開ベータでローンチ—週次アップデート・マルチエージェント・200万トークンコンテキスト

GPT-5.5、OpenAI史上最速のAPIローンチ記録—Codex収益は1週間で倍増

GoogleのGemini 3.2 Flash、正式発表前にiOSアプリとAI Studioに出現—I/O 2026での正式公開を前倒し示唆

5つのご相談入口

無料オンライン相談

コンサルティング

セミナー

講演

調査