Waseda Weekly早稲田ウィークリー

特集

早大生が柔軟発想でみずほ銀行DBを分析すると…データ科学が生む新知見

DSセンターがある喜久井町キャンパス40号館にて

DSセンターが融合する先端研究と最新データサイエンス

情報処理技術の発達によって多量かつ多種多様なデータが容易に収集・蓄積・分析できるようになり、「AI」や「ビッグデータ」などデータサイエンスに関わる言葉は現在、日常用語のように使われるようになりました。しかし集めたデータの有効活用は簡単なことではなく、深い専門知識と高度の分析スキルが要求されるため、多くの企業が困難に直面しています。

2017年12月に設立した早稲田大学DSセンター(データ科学総合研究教育センター)は、理工系・人文社会系を問わず専門分野で得られた知見と最新のデータサイエンスを融合させた最先端の研究を進め、データを活用してさまざまな分野で活躍できる人材の育成に取り組んでいます。既に他大学や企業とも大規模なネットワークを形成して、企業が持つ実際のデータを学生たちが活用する教育プログラムとして展開しているDSセンター。データ解析に関する授業も全学オープン科目として提供し、学生からの卒業論文・修士論文・学会発表の相談だけでなく、研究に関する教員からの相談も受けています。

今回のフォーカスでは、早稲田大学と協働でデータ科学人材育成プログラムを進めている、みずほ銀行の吉澤陽子・データソリューション開発部ソリューション企画チーム次長(DSセンター招聘研究員)と、ビジネスアナリティクスなどを専門とするDSセンター教務主任の須子統太・社会科学総合学術院准教授が対談し、同行の住宅ローンデータベースなどを用いた教育現場での事例や、データサイエンスの今後の展望について語り合っていただきました。

(左から)須子統太准教授、吉澤陽子氏

みずほ銀行のデータで進む共同研究

吉澤

早稲田大学とは、昨年7月に締結された学術交流協定を受け、私たちみずほ銀行が持っているデータを使い、社会システムと人間行動の理解に関する新たな知の構築にチャレンジするというテーマで共同研究を進めています。この中には「企業成長に最適なファイナンスの研究」「通勤時間と労働者の生産性に関する研究」「出身大学と居住地決定に関する分析」という三つの分野があります。私が関わっている大西宏一郎・教育・総合科学学術院准教授との共同研究では、このうちファイナンスの研究をするために学生にまず銀行データに慣れてもらおうと、住宅ローンなどといった身近なデータで、どういう仮説を見つけて分析していけるのかについて取り組んでいます。

須子

学生は実際に企業のデータに触ったことも少なく、データ分析のスキルもまだまだ、だと思うのですが。

吉澤

学生の皆さんには、まず銀行を見学してもらいました。最近のアナリティクスのツールを使うと知識がなくとも勝手に特徴量(※)が出てきたり、モデルが作られたりします。ですので、今のうちからテクニカルに行くのではなくて、ビジネスを作るための、またはビジネスに生かすための分析というのが実際にどういうものか知っていただきたいと思っています。

※)ディープラーニングや機械学習によって得られたデータにどのような特徴があるかを数値化したもの

吉澤

学生のプレゼンテーションで面白かったのが「タワーマンションの高層階に住んでいる人は、低層階に住んでいる人に比べて健康被害が大きい」という仮説でした。銀行データを使いながらその兆候が見られるなら、いずれ与信のモデルに生きるのではないかと、壮大なものを考えていて。私たちが今まで考えたことがなかったことで、非常に勉強になりました。

須子

大学だと企業と違ってすぐに役に立たなくてもいろいろな発想で考えることができます。時間も自由もあるのでそれがいいのかもしれません。

吉澤

会社の中で働いていると発想が固定化しますし、どうしても過去の企業の成功事例に頼ってしまいます。企業がいくら失敗することを奨励しても、やはり失敗を恐れて発想が乏しくなっていきます。学生の皆さんは非常に大胆に考えているので新しい発想が生まれてきて、それが企業にとってのチャレンジにつながると思っています。

データサイエンス専用ルームの開設

須子

今回、みずほ銀行のクラウド上のデータに大学内からアクセスできる専用の部屋を作りました。

吉澤

銀行にしてみれば、クラウドにデータを置くというだけではなく、それを外部の方に開放するというのはチャレンジです。もちろん個人情報など、個人を特定できる情報や非公開の企業情報は見ることができないよう加工をしてありますが、おそらく大学側でも銀行が持つセキュリティーの高い領域のデータを触るというのはすごく勇気が要るのではないかと。

須子

われわれも身の引き締まる思いです。

吉澤

データを媒体にコピーしてお渡しするというのが従来のやり方ですが、これだと研究のスピードが落ちてしまいます。それを同じプラットフォームに銀行と大学が双方からアクセスするわけです。時間も動き方も環境もバックボーンも違う学生と社会人が、同じプラットフォームで研究を一緒にしていけるというのが重要なことです。

須子

これができると他の大学にもない、かなり先進的な取り組みになります。

吉澤

将来的にはもっといろいろな企業が、同じプラットフォームに乗って、オープンコラボレーションのような形で行うことができたら、さらに世の中に対する新しい知見を発していけるという期待感もあります。

大学・企業それぞれの共同研究のメリット

須子

大学の研究者はいろいろなテーマを研究しているのですが、人文社会系の研究でも理論をデータで検証しないとなかなか論文になりません。やはり一番のボトルネックはデータがないということ。企業からデータを提供していただけたら、それだけで大きな研究上の財産となります。

吉澤

実際のビジネスでは最初にデータをクレンジング(※)した後、成型して「価値」にしていきますが、これが本当に大変です。もちろん私たちが持っている仮説や行っているビジネスの中から、データを価値にするという取り組みをずっとしてきています。しかし、それは自分たちの中から見て考える価値でしかありません。外から見て意味があって初めて本当の価値になるのだと思います。

※)重複や誤記、表記の揺れなどを修正して使用できるデータにすること

須子

学生の視点はいかがですか。

吉澤

学生たちは純粋に銀行データからどんなことができるかという視点で見ています。その視点を知ることが、私たちの新たなビジネスにつながっていくと思っています。研究に必要な範囲のデータは積極的に提供いたしますので、データを使いさまざまな分析や仮設立証にチャレンジしてください、私たちに価値を教えてください、というのが素直な気持ちです。

須子

学生のいろいろな発想の中には、他愛(たあい)もないものもあれば、きらりと光るイノベーションの種みたいなものもありますからね。

2018年7月、データサイエンス活用の裾野拡大に向けて、早稲田大学とみずほ銀行は研究・教育に関する学術交流協定を締結した

吉澤

企業同士のプロジェクトと違って、今回の包括協定は、この範囲なら自由な研究ができる、というもの。このような大きな自由は、新しい試みだと思っています。結果はきちんと求めながらも、決して何かにこだわりすぎず、幅広くやっていきたいです。

須子

「データサイエンスの活用」は、企業と大学が共同でプロジェクトを進めるにあたり、結果と自由を求めるバランスがちょうど良い分野だと思います。

吉澤

新しい分野ですね。

須子

スマートスタジアムの取り組みも面白いですね。スマートスタジアムとは、スポーツのスタジアムで客の動線をスマートフォンのアプリで管理するという試みですが、将来的にはゲームを席で観戦しながらプレーの説明が聞けて、飲み物をオーダーして届けてもらえるようになります。

吉澤

そうですね。決済とサービスが一体化したアプリを早稲田大学と共同で作っていこうとしていまして、ラグビー蹴球部に協力いただいています。

データサイエンスの課題

須子

日本のデータサイエンスを巡る課題についてどのようにお考えですか。

吉澤

金融機関においては、まずデータサイエンス人材が少ないというのが、最大の課題ですね。これまではそのような人材をあまり採用していませんし、採用して育てるプログラムも十分にそろっていません。ここ数年で人材を育てなければいけないという意識が高まり、評価をする枠組みを作り始めています。まず企業が変わらないと、求める人材は入ってこないですし、人材を生かせる場も作らないといけない。そうでないとグーグル、アップル、フェイスブック、アマゾンなどいわゆる「GAFA」やFintech企業、スタートアップ企業に行ってしまいますから。

社会科学部の須子准教授のゼミ。学生は統計解析ツールを用いた実データの分析方法などを学んでいる

須子

早稲田大学ではデータサイエンスに関わる分野のインターンシップは、学生から非常に人気があります。プログラミングなど「腕に覚えあり」というような学生が応募してくるのですが、募集定員を上回る応募があります。企業ではどれらいのスキルがある人材を必要としていますか。

吉澤

スーパーマンはいないと思っています。データエンジニアリングもデータサイエンスもデータビジネスも全部やれる人はなかなかいません。スクラム方式で、それぞれの能力にたけた人がコラボレーションしていくことが必要です。

須子

特に求められることはありますか。

吉澤

すごく大事なことは、社会に対するアンテナの高さや、世の中に対する関心を持っていることだと思います。データサイエンスは何のためにあるのかというと、社会や人の生活を向上させて、ビジネスとして発展していくためです。それに応えていくためにデータサイエンスが使われるのだとすると、人が何を望んでいるかを知り、人への関心がなければ血の通ったデータサイエンスはできないと思います。早稲田大学がすごいと思うのは、大学にあるそもそもの「知の財産」にデータサイエンスを乗せた、という発想だと思います。そういう環境で学んだ人材こそ、本当に意味のあるデータサイエンスを生み出して行くのではないかと思っています。

DSセンターが育てる人材

須子

われわれのプログラムの考え方は、データサイエンティストを育てるというよりも、政治でも経済でもスポーツでもそれぞれ興味のある専門分野を持つ学生たちに、データサイエンスの素養を広く植え付けていこうというものです。興味のない分野のデータはただの数値や文字の集まりにすぎませんが、自分の興味のある分野のデータにはいろいろな意味が見えてきます。それを題材にすることでデータサイエンスの勉強そのものが楽しくなります。研究に関するデータ解析については、学内の学生・教職員からの相談も受け付けています。DSセンターをより多くの教員・学生に利用してもらい、データサイエンスの活用方法を学んでもらうことが重要だと思っています。

吉澤

何か知りたいと思ったときに、その根拠となるデータを基にそこから事実を積み上げて、自分たちの発想を組み合わせていく、これが当たり前になってほしいです。

須子

実は「データサイエンスの考え方」は、数学が不得意な学生でもやる気があれば理解できると考えています。私のゼミでも、数学が苦手だった学生が卒業後に社内でデータサイエンスを活用して活躍しているケースもあります。必ずしもデータサイエンスは理系に特化した能力ではないと思っています。早稲田にいる約5万人の学生全てが、データサイエンスの素養を身に付けて社会に出て、幅広い分野で活躍していただきたいと思っています。

DSセンターが提供するサービス・授業

データ解析相談
【相談範囲】学内の研究に関するデータ解析
【対象者】学生・研究員・教職員
 例) 卒業論文・修士論文・学会発表に関するもの
授業(フルオンデマンド)
「データ科学入門シリーズ」(GEC設置科目)  データ科学の考え方の基礎を学ぶ
「統計リテラシーシリーズ」(GEC設置科目)  統計学の基礎「記述統計」を学ぶ
◆関連記事:統計学を利用しビッグデータを解析する
【プロフィール】
吉澤 陽子(よしざわ・ようこ)。1992年富士銀行入社。1999年持株会社みずほホールディングスへ出向。2002年みずほ銀行発足と同時に個人戦略企画・セグメント戦略再構築に従事し、その後10年以上にわたり個人向けのデータベースマーケティングに従事。近年は銀行データを活用した新たなデータビジネスの創出に取り組んでいる。
須子 統太(すこ・とうた)。専門は統計的学習理論、ビジネスアナリティクス、情報理論。博士(工学)(早稲田大学)。2014年4月、早稲田大学社会科学総合学術院専任講師。2016年4月、同准教授。

取材・文:河嶋 一郎

対談撮影:石垣 星児

【7.19開催】 と早稲田が共に創ってきたデータ科学とこれから

ビジネスもそろばんトレーニングもデータサイエンスで 社学・須子ゼミ

Page Top
WASEDA University

早稲田大学オフィシャルサイト(https://www.waseda.jp/inst/weekly/)は、以下のWebブラウザでご覧いただくことを推奨いたします。

推奨環境以外でのご利用や、推奨環境であっても設定によっては、ご利用できない場合や正しく表示されない場合がございます。より快適にご利用いただくため、お使いのブラウザを最新版に更新してご覧ください。

このままご覧いただく方は、「このまま進む」ボタンをクリックし、次ページに進んでください。

このまま進む

対応ブラウザについて

閉じる