松嶋敏泰先生の後任として2026年4月にデータ科学センター所長に就任しました酒井です。松嶋先生率いるチームが築き上げられたこの「全学横断型・学外連携型の研究教育者集団」をさらに発展させられるように努めてまいります。
大規模言語モデルなどの「AI」の時代が到来し、従来よりも広い意味でのデータサイエンスの振興が必要となっていると考えています。データサイエンスは、データからモデルや理論や知見を導き出し意思決定支援をする仕組み全般を指しますが、これからは、データ生成の社会的背景も含めて俯瞰する必要があると思います。以下、この点に関連する様々な課題のうち具体例を2つだけ挙げます。
第1に、「AI」が生成するデータの循環性の問題があります。すなわち、「AI」がネット上のデータを食べ、ネット上にデータを吐き出し、それをまた食べるという状況において、誤りや偏見が増幅されるリスクです。例えば、ジェンダーや人種の観点から見たマイノリティが軽視される傾向が強まるような循環は止めなければならないでしょう。
第2に、正解データ作成者としての「AI」と人間の分担の問題があります。正解データを必要とする「AI」タスクにおいては、人間の正解作成者が部分的もしくは全面的に「AI」に置き換わりつつあります。両者で適切な分担ができれば、拡張性と信頼性の双方を担保した正解データに基づき、有用な知識が抽出できるでしょう。一方で、人間にとって大きな負担となるタイプの正解データ作成は、依然として「AI」ではなく人間が担当するケースがあります。例えば、「AI」がエンドユーザに対して不適切な出力をしないように、裏方の人間が不適切な事例(例えば画像や言語表現)を集める作業があります。これは労働者搾取の問題です。
以上はデータサイエンスの上流に相当するデータ生成過程の話でしたが、下流についてもまた俯瞰的かつ学際的なアプローチが必要となるでしょう。例えば、人間の特定の生活様式と地球温暖化との因果関係がデータサイエンスにより客観的に示されているとします。しかし、その知見が社会に浸透するように効果的に発信し続ける努力が充分でなければ、知見は活用されず地球温暖化も止まらないでしょう。
とどのつまり、地球規模の視点で考えるソーシャルグッドのためのデータサイエンスが重要である、ということになるかと思います。この立場に基づき、「高度なデータ分析スキル」と「深い専門知識」を融合したデータ駆動型の研究と、このふたつを併せ持つ人材の育成を推し進めて参りますので、是非ご協力お願いいたします。
| 所長 | |
| 酒井 哲也 |