筑波大学高等研究院

News お知らせ

大規模言語モデル(LLM)出力を概念に沿って誘導する新枠組みを構築: より安全で透明性の高いAIへ

  • 研究成果

筑波大学人工知能科学センター(C-AIR)の研究チームは、Frame Representation Hypothesisに基づいて、大規模言語モデル(LLM)の出力を制御する新しい枠組みを開発しました。本研究成果は、Transactions of the Association for Computational Linguistics(TACL) に掲載されました。

LLMは文章を「単語」ではなく、より細かな トークン という単位に分割して処理します。そのため、長い単語や専門用語、固有名詞などは、複数トークンとして処理されます。本研究では、単語を構成する複数トークンをフレームとして捉えて、LLMの出力トークンを呈示する概念に沿って誘導する新しいメカニズム「Concept-guided text generation」を構築しました。このような呈示概念に沿った誘導制御は、誤情報や偏りの低減、説明可能性の向上など、より安全で透明性の高いLLMの実現につながることが期待されます。

論文情報
掲載誌:Transactions of the Association for Computational Linguistics (2025) 13: 1436–1458
論文タイトル:Frame Representation Hypothesis: Multi-Token LLM Interpretability and Concept-Guided Text Generation
著者:Pedro H. V. Valois, Lincon S. Souza, Erica K. Shimomoto, Kazuhiro Fukui
DOI:https://doi.org/10.1162/TACL.a.48

著者情報(抜粋)
Pedro H. V. Valois(筑波大学情報理工学位プログラム)
Lincon S. Souza (筑波大学 システム情報系 (連携大学院)/人工知能科学センター)
福井 和広(筑波大学 システム情報系/人工知能科学センター)

関連発表
本研究成果(TACL掲載論文)は、EMNLP 2025でも発表されています(同一内容の会議発表)。
さらに、本枠組みを発展させ、視覚と言語を統合したモデル(VLM)などへの応用を扱った研究を IEEE ICIP 2025で発表しています。
EMNLP 2025:https://2025.emnlp.org/program/tacl_papers/
IEEE ICIP 2025:https://ieeexplore.ieee.org/document/11084299

人工知能科学センター (C-AIR)

Contact Us お問い合わせ

筑波大学高等研究院について、
お気軽にお問い合わせください。