Autais がお届けするトピック。時事の事実・引用元付き短いまとめ(SEO 軽め・原則更新なし)。
米会計事務所向け実務管理SaaS Canopy は 2026年4月30日、業界初の AI実行レイヤー『Canopy Coworker』を発表。クライアントオンボーディングからスコープクリープ検知までを自律的に多段実行する。
Mistral AI は 2026年4月29日、128B 密モデル Medium 3.5(256k コンテキスト)をパブリックプレビューで公開。Le Chat には複数ステップタスク向けの Work Mode を導入した。
JPMorgan Chase の Lori Beer グローバルCIO が 2026年4月29日、年間198億ドル・6.5万人超のテクノロジー組織を率いるAI戦略を公表。決済から顧客対応、バックオフィスまで end-to-end でタスクを実行するエージェントAIを展開し、決済領域では手作業時間を 35% 削減した実績を共有。
Sage は 2026年4月29日(Sage Future イベント)で、財務・人事・オペレーション領域へ AIエージェントを拡張すると発表。Sage Copilot を全顧客に無償提供し、Finance Intelligence Agent も2026年後半に GA 予定。
AWS は2026年4月28日、Amazon Bedrock で OpenAI のフロンティアモデル(GPT-5.5 / GPT-5.4)、Codex、Managed Agents の Limited Preview 提供を発表した。OpenAI が Microsoft との独占関係を見直したことを受けた拡張。
Xinming Tu 氏らが 2026 年 4 月 27 日に arXiv へ投稿。エージェント評価の「失敗」が実はベンチマーク欠陥に起因する事例を指摘し、LLM をベンチマーク監査役として用いる BenchGuard を提案。BIxBench 専門家評価との一致率 83.3% を実現。
Kaushitha Silva 氏らが 2026 年 4 月 23 日に arXiv へ投稿。LLM 自身が入力を構築し実行フローをシミュレートして自己訂正する DryRUN フレームワークを提案。LiveCodeBench v6 で公開テストなしでも CodeSIM と同等性能を実現したと報告。
OpenAI は 2026年4月23日、GPT-5.5 を発表。ChatGPT の Plus/Pro/Business/Enterprise と Codex に順次展開し、翌24日には API でも提供を開始した。
Google Cloud は Cloud Next \'26(2026年4月22日、ラスベガス)で Gemini Enterprise Agent Platform の一般提供を発表。Vertex AI を統合し、エージェントの構築・統治を一元化する。
AWS は2026年4月22日、Amazon Bedrock AgentCore に新機能としてマネージドハーネス(Preview)、AgentCore CLI、コーディングアシスタント向け AgentCore Skills を追加した。CLI は IaC のガバナンスと監査性でエージェントを展開できる。
Databricks は2026年4月、Unity Catalog の Data Classification と Attribute-Based Access Control(ABAC)を一般提供開始した。同月、ai_parse_document と ai_prep_search も含めた RAG パイプライン構築機能、Lakeflow Designer、Supervisor API(Beta)を公開した。
Xero は 2026年4月22日、AIネイティブの「Xero OS」と独自AIモデル「JAX(AI CFO)」を発表。20年分の財務データと数万の金融機関接続を基盤に、自律的な会計ワークフロー実行を打ち出した。
Yeran Gamage 氏が 2026 年 4 月 22 日に arXiv へ投稿。LLM エージェントの行動制約には非対称性があり、禁止型制約は会話 5 ターン目の遵守率 73% から 16 ターン目に 33% まで低下する一方、要件型制約は 100% で維持されると報告。
Ali Al-Kaswan 氏らが 2026 年 4 月 21 日に arXiv へ投稿。仮想化ネットワーク上の現実的 Capture-The-Flag 課題で LLM エージェントを評価する DeepRed ベンチマークを提案。最高性能モデルでもチェックポイント完了率は平均 35% に留まると報告。
Hugging Face は2026年4月21日、LLM のポストトレーニングを自動化するオープンソース AI エージェント「ml-intern」を公開した。同社の smolagents フレームワーク上に構築され、文献調査からデータセット探索、学習スクリプト実行、評価までを自律実行する。
Snowflake は2026年4月21日、Snowflake Intelligence と Cortex Code の大幅拡張を発表した。MCP 連携、Skills、モバイルアプリ、VS Code 拡張、Claude Code プラグインなどを追加し、エージェント企業の制御層を目指す。
xAI は 2026年4月17日、Grok 4.3 Beta を公開。会話から PDF・スプレッドシート・PowerPoint を直接生成し、動画入力にもネイティブで対応する。
OpenAI は 4月16日、Codex に大型アップデートを実施。「ユーザーと並行して PC を操作」「画像生成」「ユーザー嗜好の記憶」「過去操作からの学習」「継続・反復作業の引き受け」が追加された。利用者は 4月初旬の週 300 万人から、2 週間後には 400 万人を超えた。
目的に合った入口からお気軽にどうぞ。すべてカジュアル相談OKです。