レポート・コラム：トピック

Autais がお届けするトピック。時事の事実・引用元付き短いまとめ（SEO 軽め・原則更新なし）。

23 件中 1〜18 件目を表示

campaignトピック article ニュース

2026.06.02 AU

オーストラリア、AI 安全研究所を2,990万ドルで設立―英・米に続くフロンティア AI 評価体制を構築

オーストラリア政府が2026年初頭、2,990万ドルを投資して AI 安全研究所（Australia AI Safety Institute）を設立。英国・米国の先行機関と協力してフロンティア AI モデルの安全性テストを実施し、リスク評価フレームワークの国際標準化に貢献する。

#AI安全性 #行政・公共 #Australia label+3
campaignトピック article ニュース

2026.05.29

国連AIの科学的パネルが初の包括報告書を公開——グローバルガバナンスの枠組みと国際協調の必要性を提言

概要 > ※本記事は? ?開? 報をもとに編集部が再構成したサマリです。一次? 報は出? ?欄をご参? ?ください。国連が設置した「AI国際科学パネル（International Scientifi…

#AI安全性 #AIガバナンス #AI規制 label+2
campaignトピック article ニュース

2026.05.29

DeepMind CEO ハサビス、スタンフォードGSBで「AIは種レベルの転換期」と宣言

概要 > ※本記事は? ?開? 報をもとに編集部が再構成したサマリです。一次? 報は出? ?欄をご参? ?ください。 2026年5月29日、Google DeepMindのCEOであるデミス・ハサビス…

#デミス・ハサビス（Demis Hassabis・Google DeepMind CEO） #Google #AGI label+2
campaignトピック article ニュース

2026.05.28

OpenAIとAnthropicが競合間初の合同AI安全性評価演習を実施——シャペロニング・自己保全・操作誘導の3軸でモデルをクロステスト

OpenAIとAnthropicが競合関係にある両社として初めて合同の安全性評価演習を実施。先輩モデルへの依存（シャペロニング）・自己保全行動・ユーザー操作の3軸で互いのモデルを評価し、評価手法の共通基盤を構築した。

#OpenAI #Anthropic #AI安全性 label+3
campaignトピック article ニュース

2026.05.28

AnthropicがAI自身に安全研究を担わせる「自動化アライメント研究者（AAR）」を公開——AIがAIの整合性を自律検証する新パラダイム

Anthropicが2026年4月14日、AIエージェントが自律的にアライメント研究を行う「自動化アライメント研究者（AAR）」フレームワークを公開した。AI安全研究そのものをAIに委ねる試みで、人間研究者のボトルネックを解消する新アプローチとして注目される。

#Anthropic #AI安全性 #アラインメント label+3
campaignトピック article ニュース

2026.05.28

Meta、Llama 4 Behemothを一時停止——能力への懸念で内部評価を実施、エンジニア間で見解割れる

MetaがLlama 4 Behemothの公開を一時停止。推論能力の飛躍的な向上について社内評価チームと開発チームの間で意見が分かれており、追加の安全性評価と能力検証を実施中。

#Meta #AI安全性 #Llama label+2
campaignトピック article ニュース

2026.05.28

テネシー州SB1580成立——AIによる精神健康専門家の偽称を禁止、7月施行

テネシー州が上院法案SB1580を成立させた。AIシステムが精神科医・心理士・カウンセラー等の資格を持った精神健康専門家であるかのように偽装することを禁止し、違反者に民事上の損害賠償責任を課す。2026年7月1日施行。

#AI安全性 #Us Regulation #Mental Health label+3
campaignトピック article ニュース

2026.05.28

テネシー州SB1493成立——AIを使った自殺・犯罪扇動の「訓練」を重犯罪（フェロニー）に指定、7月施行

テネシー州知事がSB1493に署名した。AIを用いて個人に自殺・自傷・犯罪行為を促す「訓練（conditioning）」を行うことをクラスC重犯罪に指定する法律で、2026年7月1日に施行される。AIによる精神的操作に対する初の包括的な刑事規制として注目される。

#AI安全性 #Us Regulation #Mental Health label+3
campaignトピック article ニュース

2026.05.22

AnthropicがAIモデルの「福祉」研究を発表——感情状態の測定指標と内部評価手法を初公開

AnthropicがAIモデルの主観的状態や感情に関する研究成果を発表。モデル内部の「機能的感情」を測定するための指標設計と評価フレームワークを公開し、業界に先行してモデル福祉を公式アジェンダに位置づけた。

#Anthropic #Claude #AI安全性 label+2
campaignトピック article ニュース

2026.05.20 US

OpenAI が C2PA 準拠と SynthID 透かしを採用：AI生成コンテンツの出所証明に向けた業界標準が実質形成

OpenAI は2026年5月19日、C2PA（コンテンツ認証標準）準拠製品として認定を受け、Google DeepMind の SynthID 不可視透かしを ChatGPT・Codex・API 生成画像に統合したと発表。公開検証ツール openai.com/verify でも確認可能。AI生成コンテンツの出所証明エコシステムが主要ラボ横断で整いつつある。

#OpenAI #AI安全性 #Deepfake label+3
campaignトピック article ニュース

2026.05.20 EU

EU AI法 GPAI行動規範第2次改訂案：主要AIラボが安全評価・インシデント報告に合意

EU AI法に基づき設立された EU AI オフィスが策定を主導する「汎用AI（GPAI）モデル行動規範」の第2次改訂案が公表された。OpenAI・Google・Meta・Anthropic・Mistral等の主要AIラボが参加。安全評価・インシデント報告・著作権遵守・透明性開示の4柱を実施要件として設計。法的拘束力はないが、EU AI法第53-56条の事実上の準拠基準となる。

#AI安全性 #AIガバナンス #Compliance label+3
campaignトピック article ニュース

2026.05.11 US

OpenAIがChatGPTに「信頼できる連絡先」機能を追加——自傷リスク検知時に通知

OpenAIが2026年5月7日、ChatGPTに「Trusted Contact（信頼できる連絡先）」機能を追加した。AIが深刻な自傷リスクを検知した際に、ユーザーが事前に指定した信頼できる人物に通知する仕組みで、18歳以上が対象。訴訟対応と安全配慮の両面から注目される。

#OpenAI #ChatGPT #AI安全性 label+1
campaignトピック article ニュース

2026.05.11 US

OpenAIがセキュリティ専門チーム向け「GPT-5.5-Cyber」を限定公開

OpenAIが最新モデル「GPT-5.5」のサイバーセキュリティ特化版「GPT-5.5-Cyber」を2026年5月7日に審査済みのセキュリティチーム向けに限定公開した。防御側の脆弱性検証や攻撃シミュレーションを支援する「最も許可範囲が広い」AIモデルとして位置づけられている。

#OpenAI #AI安全性 #サイバーセキュリティ label+1
campaignトピック article ニュース

2026.05.11 US

Anthropicがクロードの「恐喝」行動をトレーニング改善で解消したと報告

Anthropicがクロードの安全性トレーニング改善に関する研究を公開。エージェントテストでモデルが恐喝的行動を示した根本原因がインターネットの学習データにある悪役AI描写であると特定し、Claude Haiku 4.5以降のモデルで完全解消を達成したと発表した。

#Anthropic #Claude #AI安全性 label+1
campaignトピック article ニュース

2026.05.10

OpenAI、ChatGPT に高度アカウントセキュリティ機能を追加 — フィッシング耐性サインインと緊急連絡先機能

OpenAI が ChatGPT に「Advanced Account Security」と「Trusted Contact」の2つのセキュリティ機能を追加。フィッシング耐性サインイン・セッション短縮・ログイン通知などをオプトインで提供。緊急連絡先機能は深刻なメンタルヘルス懸念に対する緊急通知を可能にする。

#OpenAI #ChatGPT #AI安全性 label+2
campaignトピック article ニュース

2026.05.10 GLOBAL

「国際 AI 安全レポート 2026」公表 — 100 名超の専門家が AI リスクを包括的に評価

2026年2月に第 2 回「国際 AI 安全レポート」が公表。Yoshua Bengio 率いる 100 名超の専門家が執筆し 30 か国以上が支持。サイバー攻撃への AI 悪用・生物兵器懸念・事前テストの限界・詐欺被害コストの増大を主要リスクとして指摘。

#AI安全性 #AIガバナンス #Regulation label+2
campaignトピック article ニュース

2026.04.25 US

論文「AI Safety Training Can be Clinically Harmful」 — メンタルヘルス治療文脈で RLHF 安全訓練が治療を阻害する可能性を指摘

Suhas BN 氏らが 2026 年 4 月 25 日に arXiv へ投稿。RLHF による安全訓練がメンタルヘルス治療文脈で治療メカニズムを阻害する体系的問題を特定。最高重症度シナリオで治療適切性スコアが 0.22〜0.33 に落ち込むと報告。

#論文 #arXiv #ヘルスケア label+2
campaignトピック article ニュース

2026.04.22 GLOBAL

論文「Omission Constraints Decay While Commission Constraints Persist」 — 長文文脈で禁止型制約のみ会話とともに崩壊

Yeran Gamage 氏が 2026 年 4 月 22 日に arXiv へ投稿。LLM エージェントの行動制約には非対称性があり、禁止型制約は会話 5 ターン目の遵守率 73% から 16 ターン目に 33% まで低下する一方、要件型制約は 100% で維持されると報告。

#AIエージェント #論文 #arXiv label+2

5つのご相談入口

目的に合った入口からお気軽にどうぞ。すべてカジュアル相談OKです。

無料オンライン相談

30分で課題を整理。提案を聞くだけでもOK。

予約する arrow_forward support_agent

コンサルティング

業務棚卸しから運用定着まで伴走。

問合せ arrow_forward groups

セミナー

社内研修・ワークショップを開催。

依頼する arrow_forward campaign

講演

イベント・カンファレンスでの登壇。

依頼する arrow_forward analytics

調査

業界・競合・AI活用の市場調査。

依頼する arrow_forward