情報化推進レター

早稲田大学の学生・教職員の皆様に情報化推進計画のお知らせを配信させていただきます 。

教員コラム

統計学のすすめ

堀井 俊佑
メディアネットワークセンター 助教

Mr.Horii

皆さんは「ビッグデータ」という言葉を聞いたことがあるでしょうか?聞いたことが無い人も、最近のIT関連のニュースを見れば容易に見つけることが出来ると思います。話の流れから行くと、「ビッグデータというのは・・・」と繋げたい所ですが、「ビッグデータ」というものに正確な定義は無く、言葉を使っている人によっても意味合いが異なっているというのが現状のように思います。そこで一先ずここでは、「大量のデータ」を表すものとしておきましょう。この大量のデータを上手くビジネスに活かそうということで、IT業界ではこのビッグデータがブームになっており、書店に向かえば様々な関連書籍を見つけることができます。また、書店ではこれに関連して、社会人を対象とした「統計学」に関する本も数多く平積みされています。「関連して」と書いたのは、データをもとに何らかの主張をする上で、統計学は、その基盤となる学問の1つだからです。

そもそも、統計学などの技法を使って、データから知見を得ようという考え方は昔からあり、1990年〜2000年代には「データマイニング」という言葉が流行っていました。では何故今になって、ビッグデータと言葉を変えて、再びブームとなっているのでしょうか。それには様々な要因が絡んでいるように思います。

まず、扱うデータの量が爆発的な速さで増加しているという事も挙げられますが、扱うデータの質が変わり、昔では考えられなかったようなものまでデータ化されている点も大きいでしょう。通販サイト大手のAmazonでは、ユーザーの購入履歴を蓄積して、それをもとに商品の推薦を行っていることで有名ですが、これはその人の「嗜好」をデータ化していると言えます。また、FacebookなどのSNSでは、誰と誰が友達であるかを知ることができますが、これはある意味で、人の「交友関係」をデータ化していると見ることもできます。書籍「ビッグデータの正体」では、このようにあらゆる情報が「データ化」される現象を「データフィケーション」と名付けています[1]。データフィケーションの流れは今後も続くと考えられます。

ここまでの話を読んで、「自分はIT業界に就職するわけではないから関係ないかな」、と思った人もいるかもしれませんが、『データから得られた知見を意思決定に活かす』という流れはIT業界に限って存在するものではありません。政治の世界では、2012年の米国大統領選挙でオバマ氏、ロムニー氏の両陣営が大量のデータを収集し、選挙活動に活かしたとされています。データマイニングに関する国際会議に参加したら、オバマ氏の選挙チームの職募集チラシが置いてあった、という話も耳にしました。また、実話をもとにしたノンフィクション小説が原作の映画『マネーボール』では、データ分析力を競争力にして強豪チームを作り上げていく様子が描かれています。様々な分野で、「データを意思決定の材料にする」「データから新たなサービスを作る」といった能力が求められています。「ビッグデータの正体」では、「100年前は基本的な計算能力が必須だったように、これからは数学や統計学、それにプログラミングとネットワークのちょっとした知識が”現代の読み書きそろばん”になる。」と書かれています[1]。

統計学と聞くと、何だか難しそうとか、数学が苦手な自分には敷居が高い、と感じてしまって敬遠している学生も多いかもしれませんが、メディアネットワークセンターでは、文系学部の学生向けに統計学関連の講義が数多く展開されています。是非多くの学生の方にこれらの講義を受講して欲しいと思います。

参照
[1] ビクター・マイヤー=ショーンベルガー, ケネス・クキエ著, 斎藤栄一郎訳, 「ビッグデータの正体」, 講談社
Copyright(C)Media Network Center, Waseda University. All rights reserved.