日本語大規模言語モデルの構築・利活用・展開に関する研究(1期目)

日本語大規模言語モデルの構築・利活用・展開に関する研究(1期目)
Posted
Mon, 27 Apr 2026
  • 研究番号:26P20
  • 研究分野:technology
  • 研究種別:プロジェクト研究
  • 研究期間:2026年04月〜2029年03月

代表研究者

河原 大輔 教授
KAWAHARA Daisuke Professor

基幹理工学部 情報通信学科
Department of Communications and Computer Engineering

URL:https://www.nlp-waseda.jp/

研究概要

 大規模言語モデル(LLM)は急速に普及し、社会・産業・教育・行政など多様な分野で活用されつつあるが、信頼性や説明性、公平性、安全性など未解決の課題が多く存在する。特に日本語に特化したモデルは、英語圏に比べて学習資源が限定的であり、文化的・言語的特性を十分に反映した高品質モデルの構築が求められている。このような課題に対応するためには、言語情報に加えて画像・映像・音声などを含むマルチモーダル情報との統合を視野に入れ、モデルの構築から利活用・展開までを包括的に扱う基盤的研究が必要である。本研究では、ウェブ、学術論文、行政文書、対話データ、視覚・音声資料など多様な日本語情報源を統合して高品質なコーパスを構築し、それを用いて日本語に強い大規模言語モデルおよびマルチモーダル基盤モデルを開発する。さらに、内部表現や推論過程の分析を通じて、言語と視覚情報の整合性、事実性、一貫性、説明可能性を高める方法を検討し、ハルシネーションや社会的バイアスの低減を図る。加えて、教育支援、創作支援、行政文書処理、科学技術論文解析などの応用領域にモデルを展開し、実社会における利活用の効果と課題を検証する。これらの研究を通じて、学術的に信頼でき、かつ社会的にも安心して活用できる日本語大規模言語モデルを実現し、日本語処理を伴う人工知能研究の基盤強化と持続的発展に貢献する。

年次報告