Autais がお届けするトピック。時事の事実・引用元付き短いまとめ(SEO 軽め・原則更新なし)。
Muhammad Aimal Rehman 氏らが 2026 年 4 月 26 日に arXiv へ投稿。文書取得・埋め込み・ベクトル保存・グラウンディング生成・RAGAS 風評価まで R 環境内で一貫して扱える ragR パッケージを発表し、Python の RAGAS 依存を解消。
Ziyao Wang 氏ら 10 名が 2026 年 4 月 24 日に arXiv へ投稿したサーベイ論文。Vision-Language-Action (VLA) モデルの進展における主要ボトルネックは「データインフラ(データセット・ベンチマーク・データエンジン)」であると指摘し、現状のリソースを構造化して整理。
Kaushitha Silva 氏らが 2026 年 4 月 23 日に arXiv へ投稿。LLM 自身が入力を構築し実行フローをシミュレートして自己訂正する DryRUN フレームワークを提案。LiveCodeBench v6 で公開テストなしでも CodeSIM と同等性能を実現したと報告。
Yeran Gamage 氏が 2026 年 4 月 22 日に arXiv へ投稿。LLM エージェントの行動制約には非対称性があり、禁止型制約は会話 5 ターン目の遵守率 73% から 16 ターン目に 33% まで低下する一方、要件型制約は 100% で維持されると報告。
Yeonjun In 氏らが 2026 年 4 月 21 日に arXiv へ投稿。大規模推論モデルの安全性リスクは「推論構造そのもの」に起因すると主張し、わずか 1K 例の教師付きファインチューニングで安全性配置を達成する AltTrain を提案。
Xiaolei Ren 氏が 2026 年 4 月 18 日に arXiv へ投稿(4 月 21 日改訂)。攻撃なしの通常生成タスクで「機能正解だが脆弱なコード」が現れる頻度を測定する False Security Confidence (FSC) 概念を提案。3 エコシステム視点で測定境界を整理。
Worasait Suwannik 氏が 2026 年 4 月 11 日に arXiv へ投稿。公開アルゴリズム実装を 2 段階で改善するパイプラインを提案。Claude Code が再現と改善を担当し、11 実験すべてで改善を達成(各 1 営業日以内)。
Rudra Jadhav 氏らが 2026 年 4 月 8 日に arXiv へ投稿した論文。756 職業・17,998 タスクを対象に LLM の職務影響を測定する Skill Automation Feasibility Index (SAFI) を提案し、AI 相互作用の 78.7% が「自動化ではなく拡張」であると報告。
目的に合った入口からお気軽にどうぞ。すべてカジュアル相談OKです。