学会・研究会発表等
- 合成データ生成
- 太田 晋, “FinePersonas を用いた日本語指示データの合成”,
言語処理学会第31回年次大会(NLP2025) 併設ワークショップ
日本語言語資源の構築と利用性の向上(JLR2025), 2025-03-14 (発表スライド)
(コードリポジトリ)
- Susumu Ota, “Persona-Hub によるマルチターン指示データ合成”, 松尾研
LLM コミュニティ 勉強会シリーズ#5, 2025-02-02, (ハンズオン用ノートブック),
(発表録画)
- Susumu Ota, “Persona-Hub による合成データ生成”, 9/24 松尾研 LLM
開発プロジェクト “Tanuki-8x8B” 開発成果報告会 Vol. 3, 2024-09-24, (発表スライド),
(発表録画)
- 事前・事後学習データのスコア付け
- Susumu Ota, “Ask-LLM論文紹介: How to Train Data-Efficient LLMs”,
松尾研 LLM 開発プロジェクト 勉強会 2024-03-17 (発表スライド),
(コードリポジトリ)
- Iterative DPO
- Susumu Ota, “LLM-as-a-Judge と Iterative DPO
によるプリファレンスデータ合成”, 松尾研 LLM コミュニティ
勉強会シリーズ#5, 2025-02-02, (ハンズオン用ノートブック),
(発表録画)
- AI 研究エージェント
- 太田 晋, “論文紹介: MLGym: A New Framework and Benchmark for
Advancing AI Research Agents”, 第109回汎用人工知能輪読会, 2025-02-28,
(発表スライド)
- 強化学習
- 太田 晋, “Reinforcement Learning: An Introduction, 第16章
Applications and Case Studies”, Sutton輪読会, 2020-09-25, (発表スライド)
- 太田 晋, “論文紹介: Planning to Explore via Self-Supervised World
Models”, 第69回汎用人工知能輪読会, 2020-08-26, (発表スライド)
- 太田 晋,
“分散型強化学習手法の最近の動向と分散計算フレームワークRayによる実装の試み”,
Do2dle AI&機械学習しよう! 勉強会 第9回自然言語処理企画, 2020-06-20,
(発表スライド),
(コードリポジトリ),
(イベントページ)
- 太田 晋, “モデルベース強化学習の復習とMuZeroの解説”,
強化学習コロキウム, 2020-03-18, (発表スライド)
- 太田 晋, “Reinforcement Learning: An Introduction, 第12章
Eligibility Traces”, Sutton輪読会, 2019-09-10, (発表スライド)
- 太田 晋, “Reinforcement Learning: An Introduction, 第8章 Planning
and Learning with Tabular Methods”, Sutton輪読会, 2019-06-25, (発表スライド)
- 太田 晋, “Reinforcement Learning: An Introduction, 第5章 Monte Carlo
Methods”, Sutton輪読会, 2019-03-29, (発表スライド)
- 太田 晋, “Reinforcement Learning: An Introduction, 第1章
Introduction”, Sutton輪読会, 2019-01-23, (発表スライド)
- 太田 晋,
“脳のようにエビデンスを蓄積する強化学習モデルの紹介と視覚タスクへの応用”,
第30回 強化学習アーキテクチャ勉強会, 2018-12-18, (コードリポジトリ),
(イベントページ)
- AI アライメント
- 太田 晋, “論文紹介: AI Alignment: A Comprehensive Survey”,
第99回汎用人工知能輪読会, 2024-01-19, (発表スライド)
- 言語モデルの創発能力
- 太田 晋, “論文紹介: Emergent Abilities of Large Language Models”,
第90回汎用人工知能輪読会, 2023-02-22, (発表スライド)
- 集団的知能
- 太田 晋, “論文紹介: Collective Intelligence for Deep Learning: A
Survey of Recent Developments”, 第80回汎用人工知能輪読会, 2022-01-26,
(発表スライド)
コンペ受賞等
- 強化学習
- The Animal-AI Olympics 2019, カテゴリ7賞, 2019-11-02, (コンペページ),
(NeurIPS
2019 Accepted Competitions), (リーダーボード),
(記事)
- 第4回全脳アーキテクチャハッカソン, 最優秀賞, 2018-10-08, (発表スライド),
(コードリポジトリ(エージェント)),
(コードリポジトリ(環境・タスク)),
(記事)
査読付き論文
- Susumu Ota and Hideki Mima, “Machine Learning-based Syllabus
Classification toward Automatic Organization of Issue-oriented
Interdisciplinary Curricula”, Procedia - Social and Behavioral Sciences,
27, 241–247, 2011. (PDF)
- 太田 晋, 美馬 秀樹,
“課題志向別シラバス自動分類システムの設計と実装”, 自然言語処理, 16 (4),
91-106, 2009. (PDF)